COMPARATIVA DE TARJETAS GRÁFICAS. TURING VS AMPERE DE NVIDIA
SERIE 3000 VS SERIE 2000 DE GRAFICAS NVIDIA:
La serie de tarjetas gráficas RTX 3000 de Nvidia dio mucho de qué hablar en su momento debido a su gran potencia y especificaciones
mejoradas en comparación con su predecesora, la serie RTX 2000. Pero, ¿cómo ha
consiguió Nvidia aumentar tanto la potencia? En este texto, se analiza la
arquitectura Ampere de Nvidia, que es la base de la serie RTX 3000.
En la arquitectura Turing, NVIDIA añadió dos tipos de unidades
de cálculo a los streaming multiprocessors SM (núcleos del chip grafico): int 32 y fp 32. Esto significa que hay 16 núcleos que trabajan en
float 32 y 16 que trabajan en integer 32, y pueden trabajar de forma paralela.
En motores gráficos modernos, entre el 20 y el 30% de los cálculos se realizan
en int 32. Gracias a la ejecución concurrente de estas instrucciones, se
consigue un buen incremento de rendimiento.
Con Ampere, las RTX 3000 de NVIDIA han ampliado este concepto.
En cada datapack, no tenemos 16 núcleos capaces de hacer operaciones int 32 y 16 capaces de hacer float 32. Ahora, los int 32 pueden realizar tanto instrucciones en int 32 como float 32. Si el 20-30% de los cálculos de los juegos se realizan en int 32. Eso significa que en Turing hay una gran descompensación. Dentro de la gráfica, si se dan en paralelo esos cálculos int 32 y float 32. Cuando se acaben los int 32, esos núcleos se quedarán parados mientras los núcleos float 32 siguen trabajando, En Ampere se duplica la capacidad de cómputo float 32 de las RTX 3000 respecto a las RTX 2000.
Este cambio también es muy útil para el ray tracing, donde se calculan los rebotes de luz en las superficies pero nunca calculas todos los rayos de luz, ya que son infinitos. Lo que es necesario es calcular unos pocos, los menos posibles, para hacer los cálculos lo más rápido posible y lo que consigues es una imagen llena de ruido que debes eliminar , si sabes cómo es la iluminación en varios puntos de una superficie puedes calcular cómo será la iluminación de todos los puntos de esa superficie
NVIDIA tenía planeado utilizar para esto inteligencia artificial, una IA que correría en los tensor cores de la gráfica (procesadores de alto rendimiento diseñados para realizar operaciones matriciales intensivas relacionadas con el cálculo de tensores(objeto algebraico
utilizado para describir una relación multilineal entre dos objetos algebraicos relacionados asociados a un espacio vectorial)). los tensor Cores se utilizan para funciones basadas en IA como DLSS que permite a las tarjetas gráficas de NVIDIA renderizar juegos a una resolución menor y luego escalarlos a una resolución más alta, mejorando significativamente la calidad de imagen y el rendimiento.
Pero se dieron cuenta de que los filtros de eliminación de ruido que se ejecutan en los CUDA CORES son los que mejor funcionan. Estos filtros son costosos y pueden ser tanto como el propio ray tracing, pero gracias a la duplicación de la capacidad de cómputo float 32, las RTX 3000 podrán ejecutar el "the noiser" de forma mucho más rápida, mejorando el rendimiento en los juegos que utilizan ray tracing. Es la potencia de las RTX 3000 lo que las hace capaces de realizar estos cálculos complejos y mejorar el rendimiento en los juegos que utilizan ray tracing.
Por otro lado, las memorias también han sido mejoradas en la
serie RTX 3000 de Nvidia. Se ha utilizado el nuevo tipo de memoria GDDR6X en la
RTX 3090 y la RTX 3080, que alcanzan una tasa de transferencia de 21 gigabits
por segundo en comparación con los 14 gigabits por segundo de las memorias
GDDR6 utilizadas en las GPU anteriores. La RTX 3090 ha sido diseñada para estar
en un punto intermedio entre el mundo profesional y el mundo de los
videojuegos, por lo que cuenta con 24 GB de memoria y un ancho de banda que
roza el terabyte por segundo. Por otro lado, la RTX 3080 se queda con 10 GB de
memoria GDDR6X y un ancho de banda de 760 gigabytes por segundo. La RTX 3070 cuenta
con 8 GB de memoria GDDR6 y un ancho de banda de 448 GB por segundo.
| Modelo | Cuda Cores | Frecuencia Boost (MHz) | Capacidad de Procesamiento (Teraflops) |
|---|---|---|---|
| NVIDIA GeForce RTX 2060 | 1920 | 1680 | 6.5 |
| NVIDIA GeForce RTX 3060 | 3584 | 1777 | 13 |
| NVIDIA GeForce RTX 2070 | 2304 | 1620 | 7.5 |
| NVIDIA GeForce RTX 3070 | 5888 | 1725 | 20 |
| NVIDIA GeForce RTX 2080 | 2944 | 1800 | 10 |
| NVIDIA GeForce RTX 3080 | 8704 | 1710 | 29 |
| NVIDIA GeForce RTX 3090 | 10496 | 1695 | 36 |
En cuanto a la potencia de las tarjetas gráficas de la serie
RTX 3000, se puede observar una gran mejora respecto a la serie RTX 2000. La
RTX 3070 cuenta con 5.888 Cuda Cores a una frecuencia de 133 gigahercios, lo
que es un total de 20 teraflops, 2,7 veces más que su predecesora, la 2070. Las
2080, por su parte, cuenta con 8.704 Cuda Cores a 1,71 gigahercios, lo que da
un total de casi 30 teraflops, tres veces más que la 2070. Por último, la 3090
cuenta con nada más y nada menos que 10.496 Cuda Cores a una frecuencia de 1,7
gigahercios, lo que le da una potencia de cómputo total de 35,6 teraflops, 2,65
veces la potencia de cómputo de la 2080.
CONCLUSIÓN:
En resumen, la serie RTX 3000 de Nvidia ha sido diseñada
para ser una gran mejora en términos de rendimiento en comparación con la serie
RTX 2000 anterior. Las nuevas GPU cuentan con una arquitectura mejorada,
unidades dedicadas para inteligencia artificial y hardware específico para el
trazado de rayos en tiempo real. Además, la serie cuenta con un nuevo tipo de
memoria GDDR6X con tasas de transferencia mucho más rápidas. Aunque ha habido
cierta preocupación sobre la cantidad de memoria en las tarjetas más
económicas, la serie RTX 3000 sigue siendo una gran mejora en términos de
rendimiento en comparación con la serie anterior, alrededor de 3 veces superior comparando su equivalente de la serie 2000.

