COMPARATIVA DE TARJETAS GRÁFICAS. LOVELACE VS AMPERE DE NVIDIA

Índice

TECNOLOGIA DE FABRICACION:

las ventajas que se
obtienen de la tecnología de fabricación de chips de menor tamaño, como la
serie 4000 de NVIDIA RTX que utiliza la tecnología de 5 nm de TSMC, en
comparación con la serie 3000 que utiliza la tecnología de 8 nm de Samsung,
son:

Mayor eficiencia energética: Con la
reducción del tamaño del chip, se puede lograr un menor consumo de
energía. Esto se debe a que los transistores de menor tamaño requieren
menos energía para activarse y desactivarse, lo que a su vez reduce el
consumo de energía total de la tarjeta gráfica.

Mayor rendimiento: La reducción del
tamaño del chip también permite que haya más transistores en el mismo espacio,
lo que se traduce en un mayor rendimiento de la tarjeta gráfica. Por lo
tanto, se pueden obtener mejores resultados en aplicaciones que requieren
un alto rendimiento gráfico, como los juegos y la edición de video.

Menor costo: Con la reducción del tamaño
del chip, se puede utilizar menos material para producir los chips, lo que
se traduce en una reducción en los costos de producción. Además, los chips
de menor tamaño también permiten la fabricación de tarjetas gráficas más
compactas y livianas, lo que puede reducir los costos de envío y
almacenamiento.

ARQUITECTURA DE LOS
NUCLEOS:

En la arquitectura
Ampere, cada Streaming Multiprocessor (SM) contiene tanto CUDA Cores como
Tensor Cores. Los CUDA Cores en la arquitectura Ampere están organizados en
bloques de 32, con 16 núcleos capaces de realizar operaciones de punto flotante
de 32 bits (float 32) y de punto entero de 32 bits (integer 32), y los otros 16
núcleos solo son capaces de realizar operaciones de punto flotante de 32 bits
(float 32).

Por otro lado, en la
arquitectura Lovelace, cada SM también contiene tanto núcleos escalares como
Tensor Cores, en una configuración de núcleos híbridos. Los núcleos escalares
en la arquitectura Lovelace son capaces de realizar operaciones de punto
flotante de 32 bits (float 32) y de punto entero de 32 bits (integer 32),
mientras que los Tensor Cores están diseñados para realizar operaciones de
punto flotante de 16 bits (float 16) y de punto entero de 8 bits (integer 8). Los
núcleos tensor de cuarta generación de las GeForce RTX 40 pueden ofrecer una
potencia de hasta 1.400 TFLOPs en inteligencia artificial y aprendizaje
profundo

MEMORIAS:

En términos de
memoria, hay algunas diferencias notables entre las tarjetas gráficas de la
arquitectura Ampere y las de la arquitectura Lovelace de NVIDIA:

La arquitectura Ampere utiliza la
tecnología GDDR6 para su memoria de vídeo, mientras que la arquitectura
Lovelace utiliza GDDR6X. La memoria GDDR6X es una versión mejorada de la
GDDR6 que ofrece velocidades de reloj más altas y un ancho de banda de
memoria mayor.

Las tarjetas gráficas de la arquitectura
Lovelace utilizan un bus de memoria de 384 bits, mientras que la
arquitectura Ampere utiliza un bus de memoria de 320 bits. Esto significa
que las tarjetas gráficas de la arquitectura Lovelace tienen un ancho de
banda de memoria más amplio que las de la arquitectura Ampere.

La arquitectura Lovelace también incluye
una caché de nivel 2 más grande en comparación con la arquitectura Ampere.
Esta caché de nivel 2 puede ayudar a reducir la latencia de memoria y
mejorar el rendimiento en aplicaciones de gráficos y cómputo intensivas en
memoria.

Además, la arquitectura Lovelace
presenta mejoras en la eficiencia de la compresión de la memoria. Esto
significa que puede almacenar más datos en la memoria de vídeo en
comparación con la arquitectura Ampere, lo que puede ser beneficioso en
aplicaciones de gráficos y cómputo que requieren grandes cantidades de
memoria.

NUCLEOS RAY TRACING

La arquitectura
Lovelace de NVIDIA presenta una nueva generación de núcleos para ray-tracing,
conocidos como núcleos para ray-tracing de tercera generación. A continuación,
te presento algunas de las principales diferencias con respecto a los núcleos
para ray-tracing de la arquitectura Ampere:

Los núcleos para ray-tracing de tercera
generación de la arquitectura Lovelace cuentan con una mayor capacidad de
procesamiento de rayos. En comparación con la arquitectura Ampere, la
arquitectura Lovelace tiene el doble de núcleos de trazado de rayos por SM
(Streaming Multiprocessor), lo que se traduce en un mayor rendimiento de
trazado de rayos. . En la nueva generación, los núcleos RT son capaces de
alcanzar los 200 TFLOPs con el trazado de rayos. Además, incluyen
tecnologías como SER, Displaced Micro-Meshes y Opacity Micro-Mask para una
optimización más eficiente
Los núcleos para ray-tracing de tercera
generación de la arquitectura Lovelace también tienen mejoras en la
eficiencia del hardware de aceleración de BVH (Bounding Volume Hierarchy).
BVH es una técnica utilizada en la renderización de gráficos 3D para
acelerar el trazado de rayos. La mejora en la eficiencia de BVH en los
núcleos para ray-tracing de tercera generación de la arquitectura Lovelace
permite una mejor optimización del rendimiento en aplicaciones de trazado
de rayos.

La arquitectura Lovelace también presenta
una mayor cantidad de núcleos tensoriales dedicados a la aceleración de
trazado de rayos. Estos núcleos tensoriales pueden ayudar a mejorar el
rendimiento en aplicaciones de trazado de rayos que utilizan técnicas de
denoising y mejoras de calidad de imagen.

Por último, los núcleos para ray-tracing
de tercera generación de la arquitectura Lovelace también presentan una
mayor cantidad de memoria caché para almacenar y acceder a los datos de
trazado de rayos. Esto puede resultar en un mejor rendimiento en
aplicaciones de trazado de rayos que requieren grandes cantidades de
memoria.

FRECUENCIAS, CANTIDAD
DE SM Y DECODIFICADORES DE VIDEO:

las diferencias más
importantes en cuanto a frecuencias de trabajo, cómputo, cantidad de Streaming
Multiprocessors (SM) y Dual AV1 Encoders entre las arquitecturas Ampere y
Lovelace:

Frecuencias de trabajo: Las tarjetas
gráficas de la arquitectura Lovelace tienden a tener frecuencias de
trabajo ligeramente más altas que las de la arquitectura Ampere.

Cómputo: La arquitectura Lovelace
presenta mejoras significativas en términos de cómputo en comparación con
la arquitectura Ampere.

Streaming Multiprocessors: Las tarjetas
gráficas de la arquitectura Lovelace suelen tener una mayor cantidad de
Streaming Multiprocessors que las de la arquitectura Ampere

Dual AV1 Encoders: La arquitectura
Lovelace presenta una mejora significativa en términos de codificación de
video gracias a la adición de dos encoders AV1 en la tarjeta gráfica. Esto
permite una mayor eficiencia en la codificación de video y una menor carga
en el procesador.

DLSS 3:

La tecnología DLSS
(Deep Learning Super Sampling) es una técnica de renderizado que utiliza redes
neuronales para mejorar la calidad de las imágenes en tiempo real, reduciendo
el impacto en el rendimiento del sistema. A continuación, te presento algunas
de las diferencias entre DLSS en la arquitectura Ampere y Lovelace:

Nuevos modelos de redes neuronales: La
arquitectura Lovelace introduce nuevos modelos de redes neuronales que
mejoran la calidad y el rendimiento de DLSS. En particular, el modelo de
red neuronal "L1" utilizado en la arquitectura Lovelace es más
eficiente y puede procesar imágenes de mayor resolución en comparación con
el modelo "L0" utilizado en la arquitectura Ampere.

Mayor calidad y rendimiento: La
arquitectura Lovelace presenta una mejora significativa en la calidad y el
rendimiento de DLSS en comparación con la arquitectura Ampere. DLSS 3, que
combina la superresolución y la generación de fotogramas con IA, el
trazado de rayos, que simula el comportamiento realista de la luz, y el
NVIDIA Reflex, que reduce la latencia del sistema para los juegos
competitivos. Las GeForce RTX serie 40 son más que rápidas para jugadores
y creadores

Soporte para más juegos: La arquitectura
Lovelace también introduce soporte para DLSS en más juegos en comparación
con la arquitectura Ampere. Esto se debe en parte a la mejora de la
eficiencia de las redes neuronales utilizadas en la arquitectura Lovelace.