NVIDIA Hopper GH100 Chiplet GPU con 144 SM, 9216 núcleos FP32, 4608 núcleos FP64, más de 128 GB de memoria HBM3 [Report]

NVIDIA Hopper GH100 Chiplet GPU con 144 SM, 9216 núcleos FP32, 4608 núcleos FP64, más de 128 GB de memoria HBM3 [Report]

NVIDIA planea lanzar sus GPU de centro de datos Hopper de próxima generación a finales de este año, con un posible anuncio en GTC 2022 a fines de marzo. Basado en un diseño de chiplet, el GH100 acelerará la inferencia y otras cargas de trabajo de aprendizaje automático, al mismo tiempo que impulsará un rendimiento de HPC y big data récord. los El chip completo GH100 empaquetará un total de 144 SM (Multiprocesadores de transmisión) en 8 GPC (Grupos de procesamiento de gráficos) y 72 TPC (Clústeres de procesamiento de texturas).

GPU del centro de datos
NVIDIA Tesla P100
NVIDIA Tesla V100
NVIDIA A100
NVIDIA H100
Nombre en clave de la GPU
GP100
GV100
GA100
GH100
Arquitectura GPU
NVIDIA Pascal
NVIDIA Volta
NVIDIA amperio
tolva NVIDIA
SMS
56
80
108
144
TPC
28
40
54
72
Núcleos FP32 / SM
64
64
64
64
Núcleos FP32/GPU
3584
5120
6912
9216
Núcleos FP64 / SM
32
32
32
32
Núcleos FP64/GPU
1792
2560
3456
4608
Núcleos INT32 / SM
N / A
64
64
64
Núcleos INT32/GPU
N / A
5120
6912
9216
Núcleos tensoriales / SM
N / A
8
42
?
Núcleos tensoriales/GPU
N / A
640
432
?
Unidades de textura
224
320
432
576
interfaz de memoria
HBM2 de 4096 bits
HBM2 de 4096 bits
HBM2 de 5120 bits
¿HBM3 de 6144 bits?
Tamaño de la memoria
16 GB
32 GB / 16 GB
40GB
128 GB?
Tasa de datos de memoria
DDR de 703 MHz
DDR de 877,5 MHz
DDR de 1215 MHz
DDR de 1600 MHz?
ancho de banda de memoria
720 GB/s
900 GB/s
1555 GB/s
?
Tamaño de caché L2
4096KB
6144KB
40960KB
96000 KB?
TDP
300 vatios
300 vatios
400 vatios
500W?
Proceso de fabricación de TSMC
FinFET+ de 16 nm
FFN de 12 nanómetros
7 nm N7
5 nm N5

La actualización clave sobre Ampere es el TPC adicional por SM, lo que eleva el total a 72 (cada GPC contiene 9 TPC). Esto aumenta el recuento general de ALU en un 30-35 %, lo que eleva la cifra de FP32 a 9216 y la de FP64 a 4608.. Si Hopper realmente aprovechará un enfoque de chiplet, entonces probablemente estemos viendo solo uno de los dos troqueles que componen el SKU completo.

Al ejecutar los números, obtiene un total de 288 SM, 144 TPC, 16 GPC, lo que da como resultado un recuento general de núcleos de 18 432 y 9 216 para las ALU FP32 y FP64, respectivamente. Si NVIDIA quiere superar a la familia Instinct MI200 recientemente anunciada por AMD, entonces estas cifras son bastante necesarias.

El grupo de memoria también crecerá significativamente con Hopper, aumentando de “solo” 40 GB HBM2 en el GA100 a al menos 128 GB de HBM3 en el GH100. HBM 3 permite pilas de 24 GB en un bus de 1024 bits, lo que significa que NVIDIA puede usar pilas de hasta 16-24 GB en seis controladores de memoria de 1204 bits. El caché L2 es otro misterio, pero considerando que el GA100 ya tenía más de 40 MB, es probable que veamos 96 MB en el GH100, lo mismo que el AD102.

Rate this post