COMPUTING

AMD Radeon 6700 XT frente a 5700 XT: Poniendo RDNA2 a prueba

El lanzamiento de AMD 6700 XT la semana pasada nos brinda una oportunidad un poco inusual. Por lo general, las comparaciones generacionales de GPU son un poco limitadas porque los recuentos de núcleos, las unidades de textura y las configuraciones de ROP no se alinean perfectamente entre las familias. La Radeon RX 6700 XT de AMD es una excepción a esta regla y permite una comparación más precisa de RDNA frente a RDNA2 que de otro modo sería posible.

Tanto la Radeon 6700 XT como la 5700 XT cuentan con 40 CU, 160 unidades de mapeo de texturas y 64 salidas de renderizado. (2560: 160: 64). El 5700 XT tiene una canalización de memoria más amplia con un bus de memoria de 256 bits y GDDR6 de 14 Gbps. Esto equivale a 448 GB / s de ancho de banda de memoria principal. El 6700 XT, por el contrario, tiene un bus de memoria de 192 bits, GDDR6 de 16 Gbps, 384 GB / s de ancho de banda de memoria y una caché L3 de 96 MB. Hoy, examinaremos el 5700 XT contra el 6700 XT a la misma velocidad de reloj para medir los impactos en el rendimiento y la eficiencia de la nueva arquitectura, el bus de memoria más pequeño y la caché L3.

Cuadro-comparativo-de-GPU-6700XT

Según AMD, cambiar a una enorme caché L3 les permitió reducir el bus de memoria y mejorar el rendimiento. A los lectores les ha preocupado que este bus de memoria limitada pueda resultar una desventaja en los juegos, dado que un bus de memoria de 192 bits en una tarjeta de $ 479 es muy inusual.

La comparación de ambas GPU en el mismo reloj nos permite buscar mejoras adicionales de IPC (instrucciones por ciclo de reloj) entre el 5700 XT y el 6700 XT. RDNA es capaz de emitir una instrucción por ciclo de reloj, en comparación con una instrucción cada cuatro ciclos para GCN. Esto permitió a AMD reclamar una mejora de 1.25x IPC de GCN a RDNA, y aunque la compañía no ha reclamado un aumento equivalente de RDNA a RDNA2, es posible que veamos señales de optimizaciones de bajo nivel o solo el impacto general de la L3 en sí.

Estamos comparando el rendimiento del 5700 XT y el 6700 XT hoy, con ambas tarjetas bloqueadas aproximadamente a una velocidad de reloj de 1,85 GHz. También lo compararemos con el 6700 XT a máxima velocidad (SAM desactivado) para ver el rendimiento nativo y el consumo de energía de la tarjeta. En breve llegará una revisión completa de esta tarjeta, con datos de comparación de Nvidia.

Probar la configuración, la configuración y un nuevo motor de gráficos

Estamos cambiando a un nuevo motor de gráficos más capaz aquí en ET. El siguiente gráfico muestra nuestros resultados en 11 títulos para el 5700 XT (1,85 GHz). Al hacer clic en cualquiera de los botones de color junto a una tarjeta determinada, se eliminará esa tarjeta de los resultados, lo que le permitirá concentrarse en las demás. Haga clic en el botón nuevamente para restaurar los datos. Los datos se dividen en pestañas, con una resolución por pestaña.

Los resultados del juego se combinaron para los tres mapas de referencia de Total War: Troy (Batalla, Campaña y Asedio), lo que llevó a la puntuación “Combinada”. De manera similar, los resultados de los mapas de Miami y Mumbai de Hitman 2 se promediaron para producir un solo resultado. Los espacios entre las cartas en estos mapas eran proporcionales y este promedio no distorsiona la comparación general entre las tres cartas en esos títulos. Todavía hemos usado nuestros gráficos clásicos para algunos resultados que no se asignaron perfectamente al formato de resultado específico utilizado en este artículo, pero el nuevo motor es más elegante (un término técnico), por lo que planeamos usarlo para la mayoría de los proyectos en marcha. hacia adelante.

Este método de presentación evita que proporcionemos configuraciones de detalles por juego en el cuerpo del gráfico, por lo que las cubriremos a continuación:

Cenizas de la singularidad: Escalada: Detalle loco, DX12.

Assassin’s Creed: Orígenes: Ultra Detalle, DX11.

Borderlands 3
: Ultra detalle, DX12

Deus Ex: humanidad dividida
Muy alto detalle, 4x MSAA, DX12

Far Cry 5
: Ultra Detalle, Texturas de alto detalle habilitadas, DX11.

Hitman 2 combinado:
Ultra detalle, pero rendimiento medido por la velocidad de fotogramas de “GPU” informado a través de la herramienta de evaluación comparativa Esto mantiene la continuidad con los resultados anteriores de Hitman, que se informaron de la misma manera. Resultados de las pruebas de Miami y Mumbai combinados. Probado en DX12.

Metro Exodus:
: Probado en detalle extremo, con Hairworks y Advanced Physics desactivados. Extreme Detail activa 2xSSAA, renderizando de manera efectiva el juego a 4K, 5K y 8K cuando se prueban 1080p, 1440p y 4K. Probado en DX12.

Shadow of the Tomb Raider
: Probado con alto detalle, con SMAATx2 habilitado. Utiliza DX12.

Brigada extraña
: Ultra Detalle, Vulkan.

Total War: Troy combinado
: Ultra detalle, DX12.

Total War: Warhammer II
: Ultra detalle, referencia Skaven, DX12.

De los juegos que probamos, Deus Ex: Mankind Divided y Metro Exodus pusieron la carga más pesada en las GPU, con diferencia. La implementación de antialiasing multimuestra de DXMD conlleva una penalización muy fuerte y Exodus está renderizando efectivamente en 8K debido al uso de antialiasing supermuestreado.

Todos los juegos se probaron con un AMD Ryzen 9 5900X en un MSI X570 Godlike equipado con 32 GB de RAM DDR4-3200. El controlador de inicio Ryzen 6700 XT de AMD se utilizó para probar tanto el 5700 XT como el 6700 XT. ReBAR / SAM se deshabilitó: AMD no admite esta función en el 5700 XT, por lo que la deshabilitamos para nuestra comparación 6700 XT IPC. ReBAR / SAM también está deshabilitado para los resultados de “reloj completo” del 6700 XT, para garantizar una comparación de manzanas con manzanas. Tendremos resultados con SAM habilitado en nuestra revisión completa de 6700 XT.

La velocidad de reloj de 1,85 GHz es aproximada. Los relojes del juego permanecen cerca del valor mínimo, pero esto no es absoluto. Se permitió que el 6700 XT funcionara entre 1,85 GHz y 1,95 GHz y se mantuvo cerca de 1,85 GHz. El reloj del 5700 XT oscila entre 1,75 GHz y 1,95 GHz, pero en su mayoría permanece entre 1,8 y 1,9 GHz. El 6700 XT de AMD requiere un rango de reloj de GPU de 100MHz y el 5700 XT no respondió a nuestros intentos de ajustar manualmente su reloj, por lo que ajustamos el 6700 XT al rango de reloj predeterminado del 5700 XT.

Estas pruebas mostrarán cualquier cuello de botella de alta resolución / alto detalle que aparezca en el 6700 XT en comparación con el 5700 XT. Si el L3 del 6700 XT no puede compensar el aumento de la presión de la memoria, el 5700 XT debería superarlo. El reloj base predeterminado del 6700 XT es 2325MHz, o ~ 1.26x más alto que el valor mínimo de 1.85GHz que definimos. Un escalado bajo entre la Radeon 6700 XT de 1,85 GHz y la versión con reloj estándar puede significar que la presión del ancho de banda de la memoria está limitando el rendimiento.

También verificaremos la eficiencia energética entre las tarjetas porque AMD reclamó un aumento de 1.5x para RDNA2 por encima de RDNA.

Resultados y análisis de las pruebas de rendimiento

Aquí están las buenas noticias: no hay señales de que la caché L3 + bus de memoria de 192 bits ahogue el 6700 XT en cargas de trabajo realistas. Solo dos juegos muestran evidencia de presión de memoria: Metro Exodus y Deus Ex: Mankind Divided. La configuración de referencia que usamos en esos dos títulos los hace extremadamente difíciles de renderizar: Deus Ex: La implementación de MSAA de Mankind Divided es muy costosa, en todas las GPU. El ajuste preestablecido de referencia “Extreme” de Metro Exodus se renderiza a 2xSSAA. Es posible que el juego aún se reproduzca a 4K, pero internamente la GPU está generando píxeles por valor de 8K. Reducir cualquiera de estas configuraciones a un valor razonable resolvería inmediatamente el problema.

No hay señales de un cuello de botella en la memoria en el 6700 XT frente al 5700 XT en ningún otro juego que probamos. Por el contrario, un juego, Far Cry 5, muestra resultados claramente mejorados en 4K para el 6700 XT en comparación con el 5700 XT. Confirmamos estas ganancias con pruebas repetidas y confirmamos los resultados. O el caché L3 o algún otro aspecto de RDNA2 parece mejorar FC5 en 4K, en particular.

AMD ha dicho que el 6700 XT está diseñado como una GPU de 1440p y los resultados de nuestras pruebas sugieren que la resolución muestra la mayor brecha entre el 5700 XT y el 6700 XT cuando los dos están normalizados reloj por reloj. Comparado consigo mismo, la brecha entre el 1.85GHz y el reloj estándar 6700 XT también fue más amplia a 1440p.

También hemos incluido algunos resultados rápidos en dos puntos de referencia que usan escalas diferentes a nuestras pruebas anteriores y se graficaron en plantillas más antiguas: Final Fantasy XV y Neon Noir, este último como un juego de trazado de rayos poco común que se puede ejecutar en el 5700 XT.

No hay datos dramáticamente diferentes en ninguno de los conjuntos de resultados. La brecha en FFXV es la más grande en 1440p, pero a 1.85GHz, el 5700 XT atrapa (pero no pasa) al 6700 XT a 1.85GHz en 4K. En Neon Noir, el punto de referencia de trazado de rayos de Crytek, las dos GPU mantienen una brecha constante entre ellas.

Solo hay evidencia limitada de ganancias de IPC entre RDNA y RDNA2. Permitiendo un margen de error del 2-3 por ciento sobre la base del reloj de la GPU solo, y del 2-3 por ciento para la varianza de referencia a referencia, la mayoría de las brechas entre RDNA y RDNA2 desaparecen. Hay tres excepciones a 1440p: Ashes of the Singularity (6700 XT es un 15% más rápido), Assassin’s Creed: Origins (un 10% más rápido) y Total War: Warhammer II (un 8% más rápido).

Los datos agregados de todos los juegos muestran que el 6700 XT es un 3 por ciento más rápido que el 5700 XT a 1080p, un 6 por ciento más rápido a 1440p y un 5 por ciento más rápido en 4K cuando las dos GPU se comparan reloj por reloj. Cuando se prueba a máxima velocidad (con SAM desactivado), el 6700 XT de velocidad completa es 1,23 veces más rápido que el 5700 XT a 1080p, 1,3 veces más rápido a 1440p y 1,28 veces más rápido a 4K.

Estos resultados de rendimiento de reloj por reloj no se ven muy bien para RDNA2 frente a RDNA, pero no hemos verificado los datos de consumo de energía. AMD afirmó una mejora de 1,5 veces el rendimiento por vatio para RDNA2 en comparación con RDNA, y todavía no tenemos mucha evidencia de mejoras de rendimiento. Medimos el consumo de energía a carga completa durante la tercera ejecución de una prueba de referencia de Metro Exodus de tres bucles a 1080p en Extreme Detail.

Esto es muy interesante. Reloj por reloj, RDNA2 es mucho más eficiente energéticamente que RDNA. El 5700 XT y el 6700 XT funcionan prácticamente de manera idéntica en Exodus a 1080p, y el 6700 XT consume casi 100W menos de energía para hacerlo mientras tiene 12GB de RAM (desde 8GB) y un reloj de RAM de 16Gbps (1.14 veces más alto que los 14Gbps en el 5700 XT).

El 5700 XT consume 1,37 veces más energía que el 6700 XT cuando se miden al mismo reloj y con un nivel de rendimiento aproximado. Ese es un logro impresionante para una nueva arquitectura iterativa sin un nuevo nodo de proceso involucrado. Desafortunadamente, todo sale por la ventana cuando el reloj llega. Con el reloj estándar, el 6700 XT con SAM desactivado es 1,21 veces más rápido que el RDNA, pero usa aproximadamente un 3 por ciento más de energía. Claramente, AMD tiene un chip que ahorra bastante energía en relojes más bajos, pero está aprovechando el 100 por ciento del espacio de reloj disponible para competir de manera más efectiva.

Sin duda, RDNA2 ofrece a AMD un mejor escalado de reloj que el que las GPU de la compañía habían disfrutado anteriormente, pero con un gran impacto en el consumo de energía. AMD paga por una mejora de rendimiento de 1,24 veces con un aumento de 1,41 veces en el consumo de energía. Eso no está lejos de una proporción de 2: 1, y habla de la importancia de mantener la eficiencia alta y los relojes bajos en las arquitecturas de GPU. Reloj por reloj, RDNA2 es capaz de ofrecer ventajas de energía sustanciales sobre RDNA, pero AMD ha ajustado el 6700 XT para el rendimiento, no para el consumo de energía. Un hipotético 6700 a un reloj más bajo podría ofrecer un consumo de energía sustancialmente mejor, pero podría no competir eficazmente con las tarjetas Nvidia del mercado inferior.

Cuando AMD lanzó RDNA en 2019, notamos que los esfuerzos de la compañía para transformar sus GPU llevarían tiempo, y que no lo suficiente había pasado por una transformación equivalente, similar a Ryzen, de la familia de productos. Mirando RDNA2 versus RDNA, definitivamente vemos la mayor eficiencia energética que AMD estaba persiguiendo cuando se comparan el 5700 XT y el 6700 XT reloj por reloj. El bus de memoria más pequeño y la caché L3 grande parecen pagar dividendos. AMD todavía está ajustando agresivamente sus GPU para fines competitivos, pero ha encontrado nuevas eficiencias con RDNA en comparación con GCN y luego con RDNA2 en comparación con RDNA, para permitirle aumentar aún más el rendimiento.

Examinaremos la situación competitiva y de eficiencia con respecto a Nvidia más adelante esta semana.

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar