El lanzamiento de NVIDIA RTX 4080/4090 se acerca como TSMC / Partners Prep, tolva basada en chiplet para empaquetar 36,864 núcleos

El lanzamiento de NVIDIA RTX 4080/4090 se acerca como TSMC / Partners Prep, tolva basada en chiplet para empaquetar 36,864 núcleos

GeForce de próxima generación de NVIDIA Las tarjetas gráficas de la serie RTX 40 están programadas para aterrizar en algún momento de la segunda mitad de 2022, posiblemente incluso en Computex a finales de mayo. En ese frente, los socios de backend taiwaneses del fabricante de chips, en particular TSMS, ASE Technology y otros proveedores / empaquetadores de circuitos integrados, se están preparando para un lanzamiento sin problemas de la arquitectura gráfica más poderosa de la historia. La compañía planea lanzar dos alineaciones diferentes, con nombre en código Hopper y Ada Lovelace. El primero aprovechará una arquitectura basada en chiplet con dos troqueles (basado en la tecnología de empaquetado CoWoS 2.5D de TMSC) y el segundo conservará el diseño monolítico de sus predecesores.

GPU
TU102
GA102
AD102
Arco
Turing
Amperio
Ada Lovelace
Proceso
TSMC de 12 nm
Sam 8nm LPP
5 nm
GPC
6
7
12
TPC
36
42
72
SMS
72
84
144
Sombreadores
4.608
10,752
18,432
TFLOP
16,1
37,6
90 TFLOPs?
Memoria
GDDR6 de 11 GB
GDDR6X de 24 GB
GDDR6X de 24 GB
Ancho de bus
384 bits
384 bits
384 bits
TGP
250W
350W
600W?
Lanzamiento
Sep. De 2018
20 de septiembre
H2 2022

Como hemos escuchado, Hopper estará dirigido a centros de datos, HPC y cargas de trabajo centradas en IA. Después de la A100, según se informa, contará con dos troqueles AD102 (Ada) pegados entre sí utilizando CoWoS de TSMC tecnología de envasado. Esto significa que estamos ante una enorme 36,864 núcleos para la gran GPU Hopper “H100”. Para la memoria, puede estar seguro de que emparejará HBM2e o HBM3 con un bus de 1.024 bits (o superior), lo que dará como resultado un ancho de banda de 3.000-4.000 GB / s. Esto, por supuesto, tendrá un consumo de energía mucho mayor de alrededor de 1000 W (desde solo 400 W en el A100). No es exactamente sorprendente considerando el gran aumento en el rendimiento. Estamos hablando de un salto desde solo 19.5 TFLOP (FP64 / FP32) a más 150 TFLOP, con modos de cálculo de precisión mixtos que ofrecen un rendimiento aún mayor: A Aumento de 7-8x en capacidades de cómputo a través de una sola generación!

Esta imagen tiene un atributo alt vacío;  su nombre de archivo es E65gO0tVgAgIxGI.jpgTolva (Vía: @Harukaze)

Para GeForce RTX 4080 y 4090 basadas en Ada, estamos buscando el doble de rendimiento que las piezas Ampere contemporáneas, con un Recuento de núcleos FP32 de hasta 18,432. Se rumorea que el buque insignia AD102 presenta 144 SM distribuidos en 12 GPC. Eso resulta en un 71% de aumento en el rendimiento informático sin procesar (66 TFLOP) sobre el GA102. Agregue a eso el hecho de que Team Green está aprovechando el nodo de proceso N5 avanzado de TSMC para Lovelace, y el aumento de frecuencia resultante debería generar una ganancia de ~ 2.2x sobre el RTX 3090.

El ancho de bus del RTX 4080 y 4090 debería ser el mismo que el de sus predecesores (384 bits y 320 bits), junto con chips GDDR6X más rápidos, lo que da como resultado un ancho de banda de memoria aún mayor. El RTX 4090 debe contener hasta 24 GB de memoria GDDR6X y velocidades de reloj que compitan con las partes de Navi 31 (2,3-2,5 GHz). En cuanto al rendimiento general, estamos viendo alrededor de 90 TFLOP de rendimiento FP32, un gran paso por encima de los 36 TFLOP del 3090.

Si el AD102 incluye un total de 18,432 núcleos, podemos esperar aproximadamente 16.000 núcleos en el RTX 4080 y 18.000 en el RTX 4090. Según Greymon y Kopitekimi, el RTX 4080/4090 basado en Lovelace consumirá hasta 500 W de potencia bajo carga. Esto es a pesar del uso de uno de los nodos de proceso más avanzados y eficientes del planeta. Sin embargo, ejecutar los números se suma.

Se espera que el buque insignia AD102 presente 144 SM / 12 GPC, una ganancia del 71% en términos de lógica en comparación con el GA102. Incluso si el nodo N5 de TSMC tiene un 30% más de eficiencia energética que el nodo LPP de 8 nm de Samsung, estamos viendo un aumento de al menos un 80% en las unidades de hardware. Eso debería resultar fácilmente en un consumo de energía de al menos un 30-50% más que las ofertas de RTX 3080/3090 Ampere de gama alta.

Fuente: DigiTimes

Deja un comentario

A %d blogueros les gusta esto: