COMPUTING

Samsung incorpora el procesador 1.2TFLOP AI en HBM2 para aumentar la eficiencia y la velocidad

Samsung ha anunciado la disponibilidad de una nueva variación de Aquabolt. A diferencia del salto de velocidad de reloj típico o la mejora de la capacidad que esperaría, este nuevo HBM-PIM puede realizar cálculos directamente en el chip que de otro modo serían manejados por una CPU, GPU o FPGA adjunta.

PIM son las siglas de Processor-in-Memory, y es un logro notable para Samsung lograrlo. Los procesadores actualmente queman una enorme cantidad de energía moviendo datos de un lugar a otro. Mover datos lleva tiempo y cuesta energía. Cuanto menos tiempo pase una CPU moviendo datos (o esperando en otro chip para entregar datos), más tiempo podrá dedicar a realizar un trabajo computacionalmente útil.

Los desarrolladores de CPU han solucionado este problema durante años implementando varios niveles de caché e integrando la funcionalidad que alguna vez vivió en su propio socket. Tanto las FPU como los controladores de memoria se montaron una vez en la placa base en lugar de integrarse directamente en la CPU. Los chiplets en realidad trabajan directamente en contra de esta tendencia de agregación, por lo que AMD ha tenido que tener cuidado de que su diseño Zen 2 y Zen 3 pueda aumentar el rendimiento general mientras desagrega la CPU.

Si acercar la CPU y la memoria es bueno, construir elementos de procesamiento directamente en la memoria sería aún mejor. Históricamente, esto ha sido difícil porque la lógica y la DRAM generalmente se construyen de manera muy diferente. Samsung aparentemente ha resuelto este problema y ha aprovechado las capacidades de apilamiento de troqueles de HBM para mantener la densidad de memoria disponible lo suficientemente alta como para interesar a los clientes. Samsung afirma que puede ofrecer una mejora de rendimiento de más del doble con una reducción de energía del 70 por ciento al mismo tiempo, sin cambios de hardware o software necesarios. La compañía espera que la validación esté completa a fines del primer semestre de este año.

Imagen por THG

THG tiene algunos detalles sobre la nueva solución HBM-PIM, extraída de la presentación ISSCC de Samsung esta semana. El nuevo chip incorpora una Unidad de Computación Programable (PCU) con una frecuencia de reloj de solo 300MHz. El host controla la PCU a través de comandos de memoria convencionales y puede usarla para realizar cálculos FP16 directamente en DRAM. El propio HBM puede funcionar como RAM normal o en modo FIM (función en memoria).

Incluir la PCU reduce la capacidad total de memoria disponible, por lo que FIMDRAM (que es otro término que Samsung usa para esta solución) solo ofrece 6GB de capacidad por pila en lugar de los 8GB que obtendría con el HBM2 estándar. Todas las soluciones que se muestran se basan en un proceso DRAM de 20 nm.

Imagen por THG

El artículo de Samsung describe el diseño como “Función-en memoria DRAM (FIMDRAM) que integra un motor de datos múltiples de instrucción única de 16 de ancho dentro de los bancos de memoria y que explota el paralelismo a nivel de banco para proporcionar un ancho de banda de procesamiento 4 veces mayor que un solución de memoria chip “.

Imagen por THG.

Una pregunta que Samsung no ha respondido es cómo se ocupa de la disipación térmica, una razón clave por la que históricamente ha sido difícil construir una lógica de procesamiento dentro de la DRAM. Esto podría resultar doblemente difícil con HBM, en el que cada capa se apila una encima de otra. La velocidad de reloj relativamente baja en el PIM puede ser una forma de mantener fría la DRAM.

No hemos visto mucho despliegue de HBM para CPU, a pesar de Hades Canyon, pero varias GPU de gama alta de Nvidia y AMD han aprovechado HBM / HBM2 como memoria principal. No está claro si una GPU convencional se beneficiaría de esta capacidad de descarga, o cómo se integraría dicha característica en la impresionante capacidad computacional de la GPU. Sin embargo, si Samsung puede ofrecer las mejoras de rendimiento y potencia que afirma a una variedad de clientes, sin duda veremos este nuevo HBM-PIM aparecer en productos dentro de uno o dos años. Un aumento de rendimiento del doble junto con una disminución del consumo de energía del 70 por ciento es el tipo de transición de nodos de litografía de mejora de la vieja escuela que se usa para entregar de forma regular. No está claro si el PIM de Samsung se pondrá al día específicamente, pero cualquier promesa de una mejora clásica de nodo completo llamará la atención, al menos.

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar