AMD prepara controladores para Radeon RX 7900 XT/7700 XT para duplicar el rendimiento de la unidad de cómputo (CU)
AMD ha lanzado más parches LLVM para sus próximas GPU Radeon RX 7000, que se espera que se lancen más adelante este año, comenzando con la 7700 XT y la 7900 XT. La nueva actualización agrega un nuevo conjunto de instrucciones llamado VOPD. Según el comunicado, VOPD admite instrucciones wave32 de dos problemas. Esto coincide con lo que se descubrió recientemente en los controladores Radeon Linux.
def FeatureVOPD : SubtargetFeature“TieneinstanciasVOPD”,
“verdadero”,
“Tiene instrucciones wave32 de doble emisión de VOPD”LLVM
De acuerdo con el código de Linux, RDNA 3 revisará una vez más la Unidad de Cómputo, llenando hasta 128 sombreadores en cuatro unidades SIMD32. Él Work Group Processor, a su vez, incluye un total de 256 procesadores de flujo en ocho SIMD. Como sabemos, AMD cambió a un envío más corto de 32 subprocesos con RDNA, frente a los 64 de GCN. Conocido como wave32, programa 32 elementos de trabajo por SIMD para un total de 32 x2 por CU y 32 x4 por WGP.
A través de: Kepler_L2
El objetivo de esta reorganización fue mejorar la utilización y maximizar la cantidad de conjuntos de datos que se programan. Con GCN, cada unidad de cómputo funcionaría en cuatro oleadas de 64 elementos, no en una oleada de 64 elementos. Al igual que Bulldozer, el objetivo era maximizar la paralelización. Al mismo tiempo, GCN no era una arquitectura fuera de servicio. Las instrucciones dentro de un frente de onda aún se ejecutaban según su orden. La única ventaja era que la CU o las SIMD podían cambiar a cualquiera de las cuatro ondas disponibles.
A través de: anandtech
La razón por la que esto no fue muy efectivo es que la mayoría de los juegos usan colas de trabajo más cortas debido a que solo uno o dos de los cuatro frentes de onda estaban saturados por ciclo de ejecución. Como resultado, El programador GCN de AMD tuvo que esperar cuatro ciclos para la próxima ola a pesar de tener espacio para frentes de onda adicionales. RDNA soluciona esto reduciendo el tamaño de onda y aumentando el conteo de ondas. RDNA 3 duplica esto al duplicar literalmente el número de oleadas simultáneas de 32 elementos por CU y WGP.
El parche LLVM más reciente incluye soporte para Instrucciones de onda 32 “VOPD” de doble emisión sin proporcionar ningún detalle concreto al respecto. Sin embargo, esto podría referirse a la emisión de dos ondas simultáneas por programador o por SIMD (¿o CU?). De cualquier manera, RDNA 3 va a cambiar bastante las cosas en el lado rojo.
A través de: CD