El sistema «Lightning» conecta fotones con la electrónica de la computadora utilizando una nueva abstracción, creando el primer prototipo de computación fotónica para cumplir con las solicitudes de inferencia de aprendizaje automático en tiempo real.
La informática se encuentra en un punto de inflexión. La Ley de Moore, que predice que el número de transistores en un chip electrónico se duplicará cada año, se está desacelerando debido a los límites físicos de instalar más transistores en microchips asequibles. Estos aumentos en la potencia de las computadoras se están desacelerando a medida que crece la demanda de computadoras de alto rendimiento que puedan soportar modelos de inteligencia artificial cada vez más complejos. Este inconveniente ha llevado a los ingenieros a explorar nuevos métodos para ampliar las capacidades informáticas de sus máquinas, pero la solución aún no está clara.
Potencial de la computación fotónica
La computación fotónica es una solución potencial a las crecientes demandas computacionales de los modelos de aprendizaje automático. En lugar de utilizar transistores y cables, estos sistemas utilizan fotones (partículas microscópicas de luz) para realizar operaciones computacionales en el dominio analógico. Los láseres producen estos pequeños rayos de energía que se mueven a la velocidad de la luz, como una nave espacial que vuela a gran velocidad en una película de ciencia ficción. Cuando se agregan núcleos de computación fotónica a aceleradores programables, como una tarjeta de interfaz de red (NIC y su contraparte aumentada, SmartNIC), el hardware resultante se puede conectar para potenciar una computadora estándar.
Los investigadores del MIT han aprovechado el potencial de la fotónica para acelerar la informática moderna demostrando sus capacidades en el aprendizaje automático. Apodado “Lightning”, su SmartNIC fotónico-electrónico reconfigurable ayuda a las redes neuronales profundas (modelos de aprendizaje automático que imitan cómo el cerebro procesa la información) a completar tareas de inferencia como el reconocimiento de imágenes y la generación de lenguaje en chatbots como ChatGPT. El diseño innovador del prototipo permite velocidades impresionantes, creando el primer sistema informático fotónico que cumple con las solicitudes de inferencia de aprendizaje automático en tiempo real.
Superar las limitaciones fotónicas
A pesar de su potencial, un desafío importante en la implementación de dispositivos informáticos fotónicos es que son pasivos, lo que significa que no tienen memoria ni instrucciones para controlar los flujos de datos, a diferencia de sus homólogos electrónicos. Los sistemas de computación fotónica anteriores se han enfrentado a este cuello de botella, pero Lightning elimina este obstáculo para garantizar que el movimiento de datos entre los componentes electrónicos y fotónicos se produzca sin problemas.
“La computación fotónica ha demostrado ventajas significativas al acelerar tareas de computación lineal voluminosas como la multiplicación de matrices, mientras que necesita la electrónica para encargarse del resto: acceso a la memoria, cálculos no lineales y lógica condicional. Esto crea una cantidad significativa de datos que se intercambian entre la fotónica y la electrónica para completar tareas informáticas del mundo real, como una solicitud de inferencia de aprendizaje automático”, dice Zhizhen Zhong, becario postdoctoral en el grupo del profesor asociado del MIT, Manya Ghobadi, en Ciencias de la Computación del MIT. y Laboratorio de Inteligencia Artificial (CSAIL). “Controlar este flujo de datos entre la fotónica y la electrónica ha sido el talón de Aquiles de trabajos previos de computación fotónica de última generación. Incluso si tienes una computadora fotónica súper rápida, necesitarás suficientes datos para alimentarla sin fallas. De lo contrario, tendrás una supercomputadora funcionando inactiva sin realizar ningún cálculo razonable”.
Ghobadi, profesora asociada en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS) del MIT y miembro de CSAIL, y sus colegas del grupo son los primeros en identificar y resolver este problema. Para lograr esta hazaña, combinaron la velocidad de la fotónica y las capacidades de control del flujo de datos de las computadoras electrónicas.
Uniendo fotónica y electrónica
Antes de Lightning, los esquemas de computación fotónica y electrónica operaban de forma independiente y hablaban diferentes idiomas. El sistema híbrido del equipo rastrea las operaciones informáticas necesarias en la ruta de datos utilizando una abstracción de recuento de acciones reconfigurable, que conecta la fotónica a los componentes electrónicos de una computadora. Esta abstracción de programación funciona como un lenguaje unificado entre los dos, controlando el acceso a los flujos de datos que pasan. La información transportada por los electrones se traduce en luz en forma de fotones, que trabajan a la velocidad de la luz para ayudar a completar una tarea de inferencia. Luego, los fotones se convierten nuevamente en electrones para transmitir la información a la computadora.
Al conectar perfectamente la fotónica con la electrónica, la nueva abstracción de conteo-acción hace posible la rápida frecuencia de computación en tiempo real de Lightning. Intentos anteriores utilizaron un enfoque de parada y marcha, lo que significa que los datos se verían obstaculizados por un software de control mucho más lento que tomaba todas las decisiones sobre sus movimientos.
«Construir un sistema de computación fotónica sin una abstracción de programación de conteo y acción es como intentar conducir un Lamborghini sin saber conducir», dice Ghobadi, autor principal del artículo.
«¿Qué harías? Probablemente tienes un manual de conducción en una mano, luego presionas el embrague, luego revisas el manual, luego sueltas el freno, luego revisas el manual, y así sucesivamente. Esta es una operación de parar y arrancar porque Para cada decisión es necesario consultar a alguna entidad de nivel superior para que le diga qué hacer. Pero no es así como conducimos: aprendemos a conducir y luego usamos la memoria muscular sin consultar el manual ni las reglas de conducción al volante. «La abstracción de la programación de acciones actúa como la memoria muscular en Lightning. Impulsa sin problemas los electrones y fotones del sistema en tiempo de ejecución».
Una revolución informática respetuosa con el medio ambiente
Los servicios de aprendizaje automático que realizan tareas basadas en inferencia, como ChatGPT y BERT, actualmente requieren grandes recursos computacionales. No sólo son caros (algunas estimaciones muestran que ChatGPT requiere 3 millones de dólares al mes para funcionar) sino que también son perjudiciales para el medio ambiente y emiten potencialmente más del doble del dióxido de carbono que una persona promedio. Los rayos utilizan fotones que se mueven más rápido que los electrones en los cables y al mismo tiempo generan menos calor, lo que le permite calcular a una frecuencia más rápida y ser más eficiente energéticamente.
Para medir esto, el grupo Ghobadi comparó su dispositivo con unidades de procesamiento de gráficos estándar, unidades de procesamiento de datos, SmartNIC y otros aceleradores, sintetizando un chip Lightning. El equipo observó que Lightning era más eficiente energéticamente al completar solicitudes de inferencia. «Nuestros estudios de síntesis y simulación muestran que Lightning reduce el consumo de energía de inferencia del aprendizaje automático en órdenes de magnitud en comparación con los aceleradores de última generación», afirma Mingran Yang, estudiante de posgrado en el laboratorio de Ghobadi y coautor del artículo. Como opción más barata y rápida, Lightning presenta una posible actualización para que los centros de datos reduzcan la huella de carbono de su modelo de aprendizaje automático y al mismo tiempo aceleren el tiempo de respuesta de inferencia para los usuarios.
Referencia: “Lightning: una SmartNIC fotónica-electrónica reconfigurable para una inferencia rápida y energéticamente eficiente” por Zhizhen Zhong, Mingran Yang, Jay Lang, Christian Williams, Liam Kronman, Alexander Sludds, Homa Esfahanizadeh, Dirk Englund y Manya Ghobadi, SIGCOMM.
PDF
Los autores adicionales del artículo son el postdoctorado del MIT CSAIL Homa Esfahanizadeh y el estudiante de posgrado Liam Kronman, así como el profesor asociado del MIT EECS Dirk Englund y tres graduados recientes del departamento: Jay Lang ’22, MEng ’23; Christian Williams ’22, MEng ’23; y Alexander Sludds ’18, MEng ’19, PhD ’23. Su investigación ha sido apoyada, en parte, por el programa DARPA FastNICs, el programa ARPA-E ENLITENED, el Acelerador de IA DAF-MIT, la Oficina de Investigación del Ejército de los Estados Unidos a través del Instituto de Nanotecnología Soldado, subvenciones de la Fundación Nacional de Ciencias (NSF ), el Centro NSF para Redes Cuánticas y una beca Sloan.
El grupo presentará sus hallazgos este mes en el Grupo de Interés Especial en Comunicaciones de Datos de la Asociación de Maquinaria de Computación (SIGCOMM).