Nvidia RTX 3080, rendimiento sin precedentes de 4K RTX y DLSS

Nvidia RTX 3080, rendimiento sin precedentes de 4K RTX y DLSS

Han pasado dos años desde que Nvidia introdujo las primeras tarjetas gráficas de la serie RTX, la RTX 2080 y la RTX 2080 Ti. No han sido dos años fáciles para Nvidia, a quien hay que reconocer la tenacidad de haber creído en un proyecto que hoy está dando sus frutos: en 2018 el Ray Tracing era algo desconocido para la mayoría de la gente, y aunque Nvidia no ha inventado nada nuevo, ha sido capaz de impulsar la adopción de una técnica de renderizado prácticamente inutilizada hasta entonces en la industria del juego.

Recuerda que el Ray Tracing es una técnica ya muy utilizada en el mundo de los gráficos, pero lo que Nvidia ha hecho es hacerla utilizable en tiempo real.

A pesar de esto, tenemos que admitir que a Ray Tracing le ha costado mucho arraigarse en la industria. Pasamos meses teniendo sólo un puñado de videojuegos compatibles, y el rendimiento de estos juegos, una vez que se activó el Ray Tracing, estaba lejos de ser bueno. Pero la combinación con la DLSS, capaz de mejorar el rendimiento de los gráficos manteniendo casi la misma calidad (o incluso mejorándola en algunos casos), ha permitido a Nvidia hacer su oferta de tarjetas gráficas RTX cada vez más atractiva, mes tras mes.

Si no sabes lo que es el Ray tracing, puedes aprender más sobre él en este enlace: ¿Qué es Ray Tracing?

El Ray Tracing está aquí, y está aquí para quedarse, no hay duda de eso. Hasta la fecha la Nvidia es la mejor opción en este campo, y ya podemos decir que, dado en mano, el PC Gaming permanecerá imbatido en este contexto. Por supuesto que todavía tenemos que esperar la respuesta de AMD, pero por ahora esta es la situación.

Para anticiparnos a una posible crítica, les decimos desde el principio que el Ray Tracing, así como la DLSS, siguen siendo algo muy especial si consideramos sólo los números. Hasta la fecha es posible acceder a una veintena de videojuegos, aproximadamente, que permiten habilitar el Ray Tracing, y algunos de ellos sólo permiten habilitar la DLSS. Sin embargo, se han anunciado varias actualizaciones y muchos nuevos juegos de la AAA ofrecerán Ray Tracing desde el primer día, incluyendo Cyberpunk 2077.

Si no sabes lo que es la DLSS, puedes aprender más sobre ella en este enlace: ¿Qué es2.0?

La capacidad de las nuevas consolas para gestionar el Ray Tracing animará a todos los desarrolladores a utilizar esta técnica en los futuros títulos, así como a actualizar los títulos ya disponibles, como hemos visto por ejemplo con Minecraft o Fortnite. En resumen, es cierto que en este momento todavía son un puñado de títulos en comparación con la totalidad de la oferta de juegos, pero también es cierto que tenemos grandes dificultades para imaginar un futuro en el que los títulos AAA (y no sólo), no ofrezcan compatibilidad con Ray Tracing y DLSS.

Repetimos, Ray Tracing está aquí, y está aquí para quedarse.

La serie RTX 3000

Con la serie RTX 3000, Nvidia ha sorprendido, al menos por una razón: el precio. Estábamos acostumbrados a considerar la serie RTX como algo «premium», así que tuvimos que pagar un precio muy alto. Un precio totalmente injustificado en una situación en la que los videojuegos que ofrecían el Ray Tracing eran un puñado, o en la que el rendimiento era muy fluctuante.

Hoy en día Nvidia tiene un soporte de desarrollo más extenso, como dijimos, y podría haber vendido el nuevo RTX 3000 a los mismos precios altos de hace dos años, ofreciendo todavía tarjetas con un mejor valor percibido que la serie 2000. Pero afortunadamente para nosotros, Nvidia también ha revisado los precios, aumentando el valor de la oferta actual de RTX fuera de toda proporción.

No nos malinterprete, no son baratos, pero cuestan mucho menos de lo esperado. Probablemente si usted ha comprado un RTX 2080 Ti en los últimos meses por 1300 euros, ahora se enfadará mucho al descubrir que el nuevo RTX 3080, a casi la mitad de precio, ofrece un mejor rendimiento. Y no podemos evitar simpatizar con usted. Por el contrario, los que han ahorrado hasta ahora estarán muy contentos, y podrán comprar un RTX 3080 por el mismo precio que un 2080, pero disfrutando del doble de rendimiento. Estos son los datos comunicados por Nvidia, y pronto averiguaremos si los datos de rendimiento real coinciden con los indicados por la empresa, o si ésta ha sido un poco demasiado generosa con su comunicación.

En este artículo sólo nos ocupamos del RTX 3080, ya que el RTX 3070 y el RTX 3090 aún no están disponibles.

Las innovaciones tecnológicas

La serie RTX 3000 trae consigo las muchas mejoras introducidas en la arquitectura del Ampere, desde los multiprocesadores de streaming mejorados, hasta los núcleos tensores de tercera generación, los núcleos RT de segunda generación y la adaptación de memoria GDDR6X.

La nueva GPU se fabrica utilizando el proceso de producción de 8nm de Samsung, y tiene 28 mil millones de transistores. Uno de los cambios introducidos en la EM de Ampere es su capacidad para manejar operaciones de FP32 (el doble que en Turing), lo que junto con una nueva ruta de datos para operaciones de FP32 e INT32, da como resultado la capacidad de realizar 128 operaciones de FP32 por reloj (combinando las cuatro particiones). Las operaciones de Ray Tracing se benefician enormemente de esta mejora y esto lleva a un aumento exponencial del rendimiento en esta área; incluso las cargas más pesadas de Ray Tracing mostrarán los mejores beneficios.

GA 102, este es el diagrama de bloques completo de la GPU, a bordo del RTX 3090

Los tres tipos de procesadores implementados en Ampere han sido mejorados, como se ha mencionado. Desde los Shaders programables (unidades básicas de representación), que ahora ofrecen casi tres veces la capacidad de cálculo de Turing (30 Teraflops frente a 11 Turing), hasta la segunda generación de RT Cores que generan 58 Teraflops (frente a 34 Tflops en Turing), pasando por la nueva generación de Tensor Cores que son capaces de optimizar la carga de trabajo llevando la potencia de cálculo de 89 TeraFlops a 238 Teraflops.

GA 102, diagrama de bloques de la GPU a bordo del RTX 3080 SM RTX 3080

Entre los datos declarados por Nvidia, el DLSS es probablemente el más impresionante, aunque esta tecnología no ha recibido la misma atención que el Ray Tracing. Tal vez sea por la dificultad técnica de su funcionamiento, pero creemos que la DLSS es una de las soluciones más innovadoras de los últimos años. Le invitamos a leer nuestra mirada en profundidad sobre la DLSS, ya que es la clave para un alto rendimiento a altas resoluciones.

Diagrama de bloques del multiprocesador de flujo único

Nvidia mostró en la imagen de abajo cómo los «tres procesadores» pueden juntos mejorar el rendimiento calculando el tiempo de renderización de cuadros individuales. La misma escena (un cuadro) calculada con las unidades de sombreado clásicas tomaría 51ms (lo que corresponde a unos 19.6 FPS). El mismo cuadro, también calculado con núcleos RT, se renderiza en 20ms (50 FPS). Si añadimos a la ecuación la aplicación DLSS, a través de los núcleos tensores, este valor baja a 12ms, es decir, 83 FPS. Estamos hablando de un valor cuatro veces más alto de lo que un cálculo clásico de sombreado es capaz de hacer. Obviamente estamos hablando de una escena en Ray Tracing.

Con la llegada del nuevo RTX 3000 Nvidia también ha introducido un nuevo conector de alimentación de 12 pines, más pequeño que el actual de 8 pines. Esto no es un nuevo estándar y no tendrás que cambiar la fuente de alimentación, ten por seguro: en el paquete de la edición de los fundadores Nvidia incluye un adaptador que te permite usar dos clásicos de 8 pines. Algunos fabricantes de fuentes de alimentación proporcionarán cables de 12 pines de forma gratuita, pero el nuevo conector no es obligatorio, por lo que algunos modelos personalizados pueden seguir utilizando los conectores clásicos. Si deciden adoptar el nuevo estándar, los fabricantes incluirán un adaptador en el paquete, así que -repitámoslo- no tendrán ningún problema.

Memoria GDDR6X

El nuevo RTX 3000 está equipado con una memoria GDDR6X, conectada a un bus de comunicación de 320 bits, que permite una velocidad de transferencia de datos de 19Gbps (40% más alta que la de Turing).

La memoria es desarrollada por Micron, y utiliza lo que se llama PAM4 (Pulse Amplitude Modulation), lo que supone una gran mejora con respecto a PAM2 (NRZ). Este último se basa en una técnica de modulación con dos niveles de voltaje (0 y 1 en lenguaje binario), mientras que el PAM4 utiliza cuatro niveles de voltaje que representan combinaciones de dos bits lógicos (11, 10, 01 y 00). La consecuencia más clara es la duplicación de la densidad de datos transmitidos, haciendo que la GDDR6X transmita el doble de datos en la unidad de reloj que la GDDR6.

La ventaja en términos prácticos puede obtenerse principalmente en cargas de trabajo muy ávidas de datos, como la inferencia de inteligencia artificial (aprendizaje profundo), la representación de vídeo 8K y las operaciones de trazado de rayos.

RTX IO

RTX IO es un nuevo API que permite liberar a la CPU de las cargas de trabajo para la descompresión de datos que requieren los videojuegos modernos. Los desarrolladores tienden a comprimir los datos de los juegos, por una cuestión práctica del tamaño y los recursos de los sistemas modernos, pero esto implica que el trabajo de descompresión supone una gran carga para el procesador. Normalmente los datos se toman del disco duro y se cargan en la memoria del sistema (RAM), y luego son administrados por la CPU y luego se «recuperan» de la tarjeta gráfica y se almacenan en la memoria gráfica.

El RTX IO permite que la CPU y la memoria del sistema se liberen del trabajo, dejando que la GPU haga toda la descompresión y la carga directa en la memoria de gráficos. Esta API le permitirá aprovechar las ventajas de la nueva cuarta generación de PCIe SSD, que son capaces de ofrecer velocidades de transferencia de datos de hasta 7 GB por segundo.

Por el momento esta tecnología no puede ser explotada todavía, ya que requiere la API de Microsoft DirectStorage (un componente de DirectX), que todavía no está disponible. Por lo tanto, veremos los primeros beneficios de RTX IO en el futuro, tan pronto como la API esté disponible y los desarrolladores comiencen a implementar la función dentro de los videojuegos. Así que por el momento no podemos dar ninguna evaluación de la eficiencia de esta solución y cómo impactará en los juegos, pero podemos imaginar que los principales beneficios se referirán a los tiempos de carga o a los juegos de mundo abierto donde la carga mundial continua requiere la gestión de una gran cantidad de datos.

Nvidia ha estado comunicando desde hace tiempo la importancia de generar una gran cantidad de cuadros en los juegos de competición, y cómo se puede sacar provecho de ello. Sin embargo, una alta cantidad de FPS no es el único ingrediente para ganar, según Nvidia, ya que la capacidad de respuesta del PC, o en otras palabras, la latencia del sistema, también puede marcar la diferencia y mejorar el rendimiento del objetivo de un jugador.

Por lo tanto, Nvidia Reflex tiene como objetivo reducir la latencia del sistema combinando la GPU y la optimización del juego. El Reflex SDK permite controlar la cantidad de tiempo que la CPU envía el trabajo de renderizado a la GPU, evitando crear una cola de trabajo innecesaria, sincronizando en cierto modo las actividades de la CPU y la GPU. El enfoque es similar al modo de latencia ultra baja que pueden activar los controladores, pero en este caso debería ser más eficiente ya que el control se realiza a nivel del motor gráfico.

Además, el reloj de la GPU se controla y aumenta cuando es necesario para enviar el cuadro al monitor un poco antes, lo que ahorra unos milisegundos y luego disminuye la latencia. Una vez más, estamos hablando de una optimización de la función «Preferir el máximo rendimiento» que puede ser activada hoy por los conductores.

Los futuros monitores G-Sync de 360 Hz integrarán circuitos (Nvidia Reflex Latency Analyzer) que le permitirán conectar el ratón directamente al monitor para mostrar los parámetros de latencia. Una vez hecho esto, será posible modificar los parámetros de configuración del juego para obtener los mínimos valores de latencia posibles, aumentando así las posibilidades de una mayor precisión.

En la tabla de arriba se pueden ver las mejoras que según Nvidia se pueden conseguir en algunos juegos de competición. Tan pronto como haya monitores compatibles, profundizaremos con pruebas específicas.

Nvidia Broadcast

Mencionemos Nvidia Broadcast, un conjunto de herramientas más allá del rendimiento gráfico al que se puede acceder a través de las GPU de la serie RTX 3000. Gracias al codificador Nvidia se puede habilitar un efecto de pantalla verde en tiempo real sin necesidad de utilizar un fondo verde; los algoritmos IA reconocen a la persona enmarcada por la cámara web y eliminan dinámicamente el fondo, sustituyéndolo por otra imagen.

Puede utilizar su tarjeta gráfica para eliminar el ruido de fondo durante una videoconferencia, mientras que la función de «fotograma automático» le permite mantener el sujeto enfocado mientras se mueve. Exploraremos el tema en un artículo dedicado.

 

También te puede interesar:

A %d blogueros les gusta esto: