Intel ha annunciato la costruzione del più grande sistema neuromorfico al mondo, nome in codice Hala Point. Si tratta di un sistema su larga scala che utilizza il processore Intel Loihi 2 e mira a supportare la ricerca per la futura intelligenza artificiale (AI) ispirata alla struttura del cervello, e ad affrontare le sfide legate all’efficienza e alla sostenibilità dell’intelligenza artificiale oggi. Hala Point rappresenta un potenziamento della prima generazione del sistema di ricerca su grande scala Pohoiki Springs, con numerosi miglioramenti nell’architettura per ottenere una capacità neuronale oltre dieci volte più elevata e prestazioni fino a 12 volte superiori.
Il costo in temini di potenza di calcolo degli attuali modelli di intelligenza artificiale sta aumentando a ritmi insostenibili. L’industria ha bisogno di approcci fondamentalmente nuovi che consentano la scalabilità. Per questo motivo abbiamo sviluppato Hala Point, che combina l’efficienza del deep learning con nuove funzionalità di apprendimento e ottimizzazione ispirate al cervello. Ci auguriamo che la ricerca con Hala Point porti a scoperte rivoluzionarie nell’efficienza e nell’adattabilità della tecnologia AI su grande scala.
ha affermato Mike Davies, direttore del Neuromorphic Computing Lab di Intel Labs
Hala Point è il primo sistema neuromorfico su grande scala a dimostrare efficienze computazionali avanzate sui principali carichi di lavoro dell’intelligenza artificiale. La caratterizzazione mostra che può supportare 30 milioni di miliardi (quadrillion) di operazioni al secondo, o 30 petaops, con un’efficienza che supera i 15mila miliardi di operazioni al secondo per Watt (TOPS/W) durante l’esecuzione di reti neurali profonde convenzionali. Questo risultato è competitivo e supera i livelli raggiunti dalle architetture GPU e CPU. Le esclusive capacità di Hala Point possono abilitare scoperte future nel campo dell’apprendimento continuo (continuous learning) in tempo reale per applicazioni quali la risoluzione di problemi scientifici e ingegneristici, la logistica, la gestione delle infrastrutture delle città intelligenti, i modelli linguistici di grandi dimensioni (LLM) e gli agenti di intelligenza artificiale.
I ricercatori dei Sandia National Laboratories hanno in programma di utilizzare Hala Point per la ricerca informatica avanzata. L’organizzazione si concentrerà sulla risoluzione di problemi di calcolo scientifico relativi alla fisica dei dispositivi, all’architettura dei computer, all’informatica e all’informatica.
Lavorare con Hala Point in Sandia fornisce al nostro team la preziosa capacità di risolvere problemi di modellazione scientifica. Condurre ricerche con un sistema di queste dimensioni ci consentirà di ricercare capacità di calcolo, di modellazione, simulazione e analisi dei dati per tenere il passo con l’evoluzione dell’intelligenza artificiale.
aggiunge Craig Vineyard, Hala Point Team Lead, Sandia National Laboratories
Attualmente, Hala Point è un prototipo di ricerca che migliorerà le capacità dei futuri sistemi disponibili in commercio. Intel prevede di apprendere informazioni che porteranno a scoperte di utilizzo pratico, come la capacità dei Large Language Model (LLM) di apprendere continuamente da nuovi dati. Tali scoperte promettono di ridurre in modo significativo l’insostenibile onere formativo che la crescita esponenziale dell’AI porta con sé.
La recente tendenza ad ampliare i modelli di deep learning a migliaia di miliardi (trillion) di parametri ha messo in luce problematiche legate alla sostenibilità nell’intelligenza artificiale e hanno evidenziato la necessità di innovare ai livelli più bassi dell’architettura hardware. Il calcolo neuromorfico è un approccio fondamentalmente nuovo che si basa sulle intuizioni delle neuroscienze che integrano memoria e calcolo con un parallelismo altamente granulare per ridurre al minimo lo spostamento dei dati. Negli atti del convegno della International Conference on Acoustics, Speech, and Signal Processing (ICASSP) tenuta nel mese di aprile, Loihi 2 ha dimostrato miglioramenti di ordini di grandezza in termini di efficienza, velocità e adattabilità dei carichi di lavoro emergenti su piccola scala.
Con numerosi miglioramenti rispetto al suo predecessore Pohoiki Springs, Hala Point ora apporta accresce le prestazioni e l’efficienza del calcolo neuromorfico applicato ai modelli di deep learning convenzionali, in particolare quelli che elaborano carichi di lavoro in tempo reale quali video, parlato e comunicazioni wireless. Ad esempio, Ericsson Research sta utilizzando Loihi 2 per ottimizzare l’efficienza delle infrastrutture di telecomunicazioni, come evidenziato al Mobile World Congress di quest’anno.
I processori neuromorfici Loihi 2, che costituiscono la base di Hala Point, applicano principi informatici ispirati al cervello, quali reti neurali spiking (SNN) asincrone e basate su eventi, memoria e calcolo integrati e connessioni sparse e in continua evoluzione, per ottenere miglioramenti di ordini di grandezza in termini di consumo energetico e prestazioni. I neuroni comunicano direttamente tra loro anziché comunicare attraverso la memoria, riducendo il consumo energetico complessivo.
Hala Point comprende 1.152 processori Loihi 2 in uno chassis per data center da sei unità rack delle dimensioni di un forno a microonde. Il sistema supporta fino a 1,15 miliardi di neuroni e 128 miliardi di sinapsi distribuiti su 140.544 nuclei di elaborazione neuromorfica che consumano un massimo di 2.600 Watt di potenza. Il sistema include inoltre oltre 2.300 processori x86 per calcoli ausiliari.
Hala Point integra canali di calcolo, memoria e comunicazione in una struttura massivamente parallelizzata, fornendo un totale di 16 petabyte al secondo (PB/s) di ampiezza di banda di memoria, 11 PB/s di ampiezza di banda di comunicazione inter-core e 5,5 TB/s di ampiezza di banda di memoria. larghezza di banda di comunicazione tra chip. Il sistema può elaborare oltre 380mila miliardi di operazioni sinaptiche a 8 bit al secondo e oltre 240mila miliardi di operazioni neuronali al secondo.
Applicato a modelli di rete neurale di ispirazione biologica, il sistema può eseguire la sua piena capacità di 1,15 miliardi di neuroni 20 volte più velocemente rispetto alle velocità biologiche in tempo reale, e fino a 200 volte più veloci rispetto a capacità inferiori. Benché Hala Point non sia pensato per la modellazione neuroscientifica, la sua capacità neuronale è circa equivalente a quella della corteccia cerebrale di un gufo o di una scimmia cappuccina.
I sistemi basati su Loihi possono eseguire l’inferenza AI e risolvere problemi di ottimizzazione utilizzando 100 volte meno energia, a velocità fino a 50 volte superiori, rispetto alle architetture CPU e GPU convenzionali. Sfruttando la connettività sparsa fino a 10:1 e l’attività event-driven, i primi risultati su Hala Point mostrano che il sistema può raggiungere efficienze di rete neurale profonda fino a 15 TOPS/W senza richiedere la raccolta dei dati di input in batch, un metodo ottimizzazione comune per le GPU che ritarda notevolmente l’elaborazione dei dati che arrivano in tempo reale, come i video provenienti dalle telecamere. Mentre sono ancora in fase di ricerca, i futuri LLM neuromorfici capaci di apprendimento continuo potrebbero portare a gigawattora di risparmio energetico eliminando la necessità di riqualificazione periodica con dataset in continua crescita.
La presentazione di Hala Point ai Sandia National Labs è la prima implementazione di una nuova famiglia di sistemi di ricerca neuromorfici su larga scala che Intel prevede di condividere con i propri partner di ricerca. Ulteriori sviluppi consentiranno alle applicazioni di calcolo neuromorfico di superare i vincoli di potenza e latenza che limitano l’implementazione delle capacità di intelligenza artificiale nel mondo reale e in tempo reale.
Insieme a un ecosistema di oltre 200 membri della Intel Neuromorphic Research Community (INRC), tra cui importanti gruppi accademici, laboratori governativi, istituti di ricerca e aziende in tutto il mondo, Intel è al lavoro per ampliare i confini dell’intelligenza artificiale ispirata al cervello e far progredire questa tecnologia dalla ricerca prototipi di prodotti commerciali leader del settore nei prossimi anni.