CIENCIA

Cerebras Wafer incluye CPU de 2,6 billones de transistores con 850.000 núcleos

Hace unos años, comenzamos a ver investigadores discutiendo una vieja idea de fabricación explorada por primera vez en la década de 1980: el procesamiento a escala de obleas. La idea de WSP es sencilla: en lugar de cortar una oblea en chips individuales y luego empaquetar esos chips para revenderlos, construya un solo núcleo o una colección de núcleos usando gran parte, si no toda, de la oblea para un solo chip.

La startup de inteligencia artificial / aprendizaje automático Cerebras ha revivido la idea del procesamiento a escala de obleas para un procesador de primera generación que cubrimos el año pasado. El “antiguo” motor de escala de obleas de Cerebras (CWSE) era una oblea de 16 nm con 400.000 núcleos AI, transistores 1.2T, 18GB de memoria integrada, 9 PB / s de ancho de banda de memoria total y 100Pb / s de ancho de banda de tejido total. La nueva versión del CWSE supuestamente es aún más grande:

Eso es un montón de transistores. Y núcleos. Y probablemente el consumo de energía, aunque los datos de otras compañías sugieren que el cambio de 16 nmFF a 7 nm ofrece algunos ahorros de energía significativos. El motor a escala de obleas de próxima generación de Cerebras presentará detalles adicionales hoy en Hot Chips, pero hasta ahora ha sido uno de los favoritos del mercado de la IA.

Cerebras aprovecha un enfoque macroscópico para un problema microscópico. Irónicamente, los chiplets y los diseños a escala de obleas son intentos de encontrar una solución a los problemas de empaquetado y eficiencia energética de la informática moderna. Los chiplets se enfocan en optimizar el área de la matriz y dividir un procesador en bloques funcionales que tengan más sentido para los nodos de proceso en los que se implementan. Los chiplets refutan el antiguo principio de la ley de Moore de que la integración es siempre lo mejor y se centran en integrar los componentes donde el enfoque todavía tiene sentido. El procesamiento a escala de obleas también se ocupa de la integración, pero desde la perspectiva del sistema como una plataforma total, también pasa por alto mucha integración a favor de una relación fundamentalmente diferente entre los bloques funcionales.

Motor Cerebras a escala de obleas (ensamblado). Imagen de Cerebras

Tradicionalmente, una CPU o GPU es una pieza de silicio mucho más pequeña (limitada por el tamaño máximo de retícula de la fundición, al menos) unida a un paquete, montada en una PCB. Una sola placa base que monta de 4 a 10 placas aceleradoras también es un sistema integrado, y uno con muchas ineficiencias en su interior, una vez que comienza a considerar el retraso del cable y el consumo de energía general. Al unir núcleos, Cerebras pasa por alto los límites de fabricación que normalmente evitarían que un procesador a escala de obleas sea factible en primer lugar. Un enfoque diferente de la integración, en ambos casos, arroja mejoras fundamentales donde la misma vieja forma de hacer las cosas ha comenzado a fallarnos.

Por supuesto, hay una gran diferencia entre los chiplets y WSE: los chiplets ya están disponibles en los productos de consumo de AMD, mientras que los motores a escala de obleas consumen ~ 15kW de potencia y solo están disponibles para instalación personal en su guarida del mal y / o base lunar.

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar