COMPUTING

Caché L2 vs. L3: ¿Cuál es la diferencia?

Caché de cerca y personal

Las CPU tienen varios niveles de almacenamiento en caché. Hemos hablado de las estructuras de la caché en general, en nuestro explicador L1 y L2, pero no hemos dedicado tanto tiempo a discutir cómo funciona una L3 o en qué se diferencia de una caché L1 o L2.

En el nivel más simple, un caché L3 es solo una versión más grande y más lenta del caché L2. Cuando la mayoría de los chips eran procesadores de un solo núcleo, esto era cierto en general. Las primeras memorias caché L3 se construyeron en la propia placa base, conectadas a la CPU a través del bus de la parte trasera (a diferencia del bus de la parte frontal). Cuando AMD lanzó su familia de procesadores K6-III, muchas placas base K6 / K-2 existentes también podían aceptar un K6-III. Normalmente, estas placas tenían 512 K-2 MB de caché L2; cuando se insertaba un K6-III, con su caché L2 integrado, estos cachés más lentos basados ​​en la placa base se convertían en L3 en su lugar.

Para el cambio de siglo, colocar un caché L3 adicional en un chip se había convertido en una manera fácil de mejorar el rendimiento: el primer Pentium 4 “Extreme Edition” de Intel orientado al consumidor fue un Gallatin Xeon reutilizado con un chip L3 de 2 MB. Agregar ese caché fue suficiente para comprar el Pentium 4 EE con un aumento de rendimiento del 10 al 20 por ciento sobre la línea estándar de Northwood.

Caché y Curveball de varios núcleos

A medida que los procesadores multinúcleo se volvieron más comunes, la caché L3 comenzó a aparecer con mayor frecuencia en el hardware del consumidor. Estos chips, como el Nehalem de Intel y el K10 de AMD (Barcelona) usaban L3 como algo más que un tope más grande y lento para L2. Además de esta función, la caché L3 suele compartido entre todos los procesadores en una sola pieza de silicio. Eso contrasta con las cachés L1 y L2, las cuales tienden a ser privadas y dedicadas a las necesidades de cada núcleo en particular. (El diseño Bulldozer de AMD es una excepción a esto: Bulldozer, Piledriver y Steamroller comparten un caché de instrucciones L1 común entre los dos núcleos de cada módulo). Los procesadores Ryzen de AMD basados ​​en los núcleos Zen, Zen + y Zen 2 comparten un L3 común, pero la estructura de los módulos CCX de AMD dejó a la CPU funcionando más como si tuviera 2 x 8 MB de cachés L3, uno para cada clúster CCX, en lugar de uno grande. , caché L3 unificado como una CPU Intel estándar.

El cambio de topología Zen 2 – Zen 3. Esta diapositiva es del lanzamiento del Ryzen Mobile 5000 de AMD, pero el cambio también ocurrió en el escritorio.

Los cachés privados L1 / L2 y un L3 compartido no son la única forma de diseñar una jerarquía de caché, pero es un enfoque común que han adoptado varios proveedores. Dar a cada núcleo individual un L1 y L2 dedicados reduce las latencias de acceso y reduce la posibilidad de contención de caché, lo que significa que dos núcleos diferentes no sobrescribirán los datos vitales que el otro colocó en una ubicación a favor de su propia carga de trabajo. La caché L3 común es más lenta pero mucho más grande, lo que significa que puede almacenar datos para todos los núcleos a la vez. Se utilizan algoritmos sofisticados para garantizar que Core 0 tiende a almacenar la información más cercana a sí mismo, mientras que Core 7 a través del dado también acerca los datos necesarios a sí mismo.

A diferencia del L1 y L2, que casi siempre son privados y centrados en la CPU, el L3 también se puede compartir con otros dispositivos o capacidades. Las CPU Sandy Bridge de Intel compartían una caché L3 de 8 MB con el núcleo de gráficos integrado (Ivy Bridge le dio a la GPU su propia porción dedicada de caché L3 en lugar de compartir los 8 MB completos). La documentación de Tiger Lake de Intel indica que la memoria caché de la CPU integrada también puede funcionar como LLC para la GPU.

A diferencia de los cachés L1 y L2, los cuales son típicamente fijos y varían solo muy levemente (y principalmente para partes de presupuesto), tanto AMD como Intel ofrecen chips diferentes con cantidades significativamente diferentes de L3. Intel normalmente vende al menos algunos Xeons con recuentos de núcleos más bajos, frecuencias más altas y una relación de caché por CPU L3 más alta. El Epyc 7F52 de AMD combina una caché L3 completa de 256 MB con solo 16 núcleos y 32 subprocesos.

Hoy en día, el L3 se caracteriza por ser un conjunto de memoria rápida común a todas las CPU de un SoC. A menudo se bloquea de forma independiente del resto del núcleo de la CPU y se puede dividir dinámicamente para equilibrar la velocidad de acceso, el consumo de energía y la capacidad de almacenamiento. Si bien no es tan rápido como L1 o L2, a menudo es más flexible y juega un papel vital en la gestión de la comunicación entre núcleos. Tampoco es raro ver que los cachés L3 se utilizan como una LLC compartida por la CPU y la GPU, o incluso ver aparecer un caché L3 enorme en tarjetas gráficas como la arquitectura RDNA2 de AMD.

  • Cómo funcionan las memorias caché de CPU L1 y L2 y por qué son una parte esencial de los chips modernos
  • Informe: Rocket Lake de Intel funciona tan caliente como 98C, consume hasta 250W
  • AMD advierte que la escasez de componentes de Xbox, PS5 y PC podría persistir hasta el verano

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar