Source article: DeepSeek and the Coming AI Cambrian Explosion | by the New SingularityNet | SingularityNET
Translation by: Hugodove
Dework task: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=a111eae9-423d-4a79-8f8f-eb4fafff5063
Community review: Please leave comments below about translation quality or like this post if it is well translated
DeepSeek e l’imminente esplosione cambriana dell’intelligenza artificiale
L’entusiasmo per DeepSeek è comprensibile, ma molte delle reazioni che vedo sembrano un po’ fuori strada. DeepSeek rappresenta un significativo aumento di efficienza nello spazio LLM, che avrà un impatto importante sulla natura e sull’economia delle applicazioni LLM. Tuttavia, ciò non segnala una svolta fondamentale nell’intelligenza generale artificiale (AGI), né uno spostamento fondamentale del centro di gravità dell’innovazione dell’IA. Si tratta di un salto improvviso lungo una traiettoria prevista piuttosto che di un cambiamento di paradigma dirompente.
Correre lungo la curva dell’efficienza
Gli impressionanti risultati di DeepSeek rispecchiano il modello storico più ampio del progresso tecnologico. All’inizio degli anni '90, il rendering della grafica computerizzata di fascia alta richiedeva supercomputer; ora è fatto sugli smartphone. Il riconoscimento facciale, una volta una costosa applicazione di nicchia, è ora una caratteristica di base. Lo stesso principio si applica ai modelli linguistici di grandi dimensioni (LLM). La sorpresa non è la natura del progresso, ma la velocità.
Per coloro che prestano attenzione alla crescita tecnologica esponenziale, questo non è scioccante. Il concetto di singolarità tecnologica prevede un cambiamento accelerato, in particolare nelle aree di scoperta e invenzione automatizzate come l’intelligenza artificiale. Man mano che ci avviciniamo alla Singolarità, le scoperte sembreranno sempre più rapide. DeepSeek è solo uno dei tanti momenti di questo megatrend in evoluzione.
Le innovazioni architettoniche di DeepSeek: impressionanti, ma non nuove
Il risultato principale di DeepSeek risiede nell’ottimizzazione dell’efficienza piuttosto che nella ridefinizione dell’architettura AI. Il suo modello Mixture of Experts (MoE) è una nuova modifica di una tecnica di apprendimento d’insieme ben consolidata che è stata utilizzata per anni nella ricerca sull’intelligenza artificiale. Ciò che DeepSeek ha fatto particolarmente bene è stato perfezionare il MoE insieme ad altri trucchi di efficienza per ridurre al minimo i costi computazionali:
- Efficienza dei parametri: il design MoE di DeepSeek attiva solo 37 miliardi dei suoi 671 miliardi di parametri alla volta. Ciò significa che richiede solo 1/18 della potenza di calcolo dei tradizionali LLM.
- Apprendimento per rinforzo per il ragionamento: invece dell’ingegneria manuale, il modello R1 di DeepSeek migliora il ragionamento basato sulla catena di pensiero tramite l’apprendimento per rinforzo.
- Addestramento multi-token: DeepSeek-V3 può prevedere più parti di testo contemporaneamente, aumentando l’efficienza dell’addestramento.
Queste ottimizzazioni consentono ai modelli DeepSeek di essere molto più economici rispetto a concorrenti come OpenAI o Anthropic, sia per l’addestramento che per l’inferenza. Questa non è un’impresa banale: è un passo importante verso rendere più accessibili i LLM di alta qualità. Ma ancora una volta, si tratta di un perfezionamento ingegneristico stellare, non di un salto concettuale verso l’AGI.
Il noto potere dell’Open Source
Una delle mosse più grandi di DeepSeek è rendere il suo modello open source. Questo è in netto contrasto con le strategie del giardino recintato di OpenAI, Anthropic e Google – e un cenno nella direzione di Yann LeCun di Meta. L’intelligenza artificiale open source favorisce la rapida innovazione, un’adozione più ampia e il miglioramento collettivo. Mentre i modelli proprietari consentono alle aziende di ottenere maggiori entrate dirette, l’approccio di DeepSeek si allinea con un futuro dell’IA più decentralizzato, in cui gli strumenti sono disponibili per più ricercatori, aziende e sviluppatori indipendenti.
L’hedge fund HighFlyer dietro DeepSeek sa che l’intelligenza artificiale open source non è solo una questione di filosofia e di fare del bene al mondo; è anche un buon affare. OpenAI e Anthropic hanno difficoltà a trovare un equilibrio tra ricerca e monetizzazione. La decisione di DeepSeek di rendere R1 open source segnala la fiducia in un modello economico diverso, basato su servizi, integrazione aziendale e hosting scalabile. Fornisce inoltre alla comunità globale dell’intelligenza artificiale un set di strumenti competitivi, riducendo la presa dell’egemonia delle Big Tech americane.
Il ruolo della Cina nella corsa all’intelligenza artificiale
Alcuni in Occidente sono rimasti sorpresi dal fatto che la svolta di DeepSeek sia arrivata dalla Cina. Non sono così sorpreso. Avendo trascorso un decennio in Cina, ho assistito in prima persona alla portata degli investimenti nella ricerca sull’intelligenza artificiale, al numero crescente di dottorati di ricerca e all’intensa attenzione nel rendere l’intelligenza artificiale potente ed economicamente efficiente. Questa non è la prima volta che la Cina prende un’innovazione occidentale e la ottimizza rapidamente in termini di efficienza e scala.
Tuttavia, anziché considerarlo esclusivamente come un contesto geopolitico, lo vedo come un passo verso un panorama dell’intelligenza artificiale più integrato a livello globale. È molto più probabile che un’AGI benefica emerga da una collaborazione aperta che da silos nazionalistici. Uno sforzo di sviluppo dell’AGI decentralizzato e distribuito a livello globale, piuttosto che un monopolio da parte di un singolo paese o azienda, ci offre una possibilità migliore per garantire che l’IA sia al servizio dell’umanità nel suo complesso.
Implicazioni più ampie di DeepSeek: il futuro oltre gli LLM
L’entusiasmo attorno a DeepSeek è in gran parte incentrato sulla sua efficienza in termini di costi e sull’impatto sul mercato LLM. Ma ora più che mai dobbiamo davvero fare un passo indietro e considerare il quadro più ampio.
- Gli LLM non sono il futuro dell’AGI
- Sebbene i modelli basati sui trasformatori possano automatizzare le attività economiche e integrarsi in vari settori, mancano di capacità AGI fondamentali come l’astrazione compositiva fondata e il ragionamento autodiretto.
- Se l’AGI emergerà entro il prossimo decennio, è improbabile che sia basata esclusivamente sui trasformatori. Architetture alternative, come OpenCog Hyperon e il calcolo neuromorfico, potrebbero rivelarsi più fondamentali per raggiungere una vera intelligenza generale.
- La mercificazione degli LLM sposterà gli investimenti nell’intelligenza artificiale
- I miglioramenti in termini di efficienza di DeepSeek accelerano la tendenza degli LLM a diventare una merce. Con il calo dei costi, gli investitori potrebbero iniziare a guardare verso la prossima frontiera dell’innovazione dell’intelligenza artificiale.
- Ciò potrebbe indirizzare i finanziamenti verso architetture AGI oltre i trasformatori, hardware AI alternativo (ad esempio unità di elaborazione associativa, chip neuromorfici) e reti AI decentralizzate.
- La decentralizzazione darà forma al futuro dell’intelligenza artificiale
- Il panorama dell’intelligenza artificiale si sta spostando verso architetture decentralizzate che danno priorità alla privacy, all’interoperabilità e al controllo degli utenti.
- I miglioramenti in termini di efficienza di DeepSeek rendono più semplice l’implementazione di modelli di intelligenza artificiale in reti decentralizzate, come quelle di SingularityNET e ASI Alliance, riducendo la dipendenza dai giganti della tecnologia centralizzata.
Il ruolo di DeepSeek nell’esplosione cambriana dell’intelligenza artificiale
DeepSeek rappresenta un’importante pietra miliare nell’efficienza dell’IA, ma non riscrive la traiettoria fondamentale dello sviluppo dell’AGI. È un’accelerazione improvvisa lungo una curva prevedibile, non un cambiamento di paradigma. Tuttavia, il suo impatto sull’ecosistema dell’intelligenza artificiale è significativo:
- Ciò spinge operatori storici come OpenAI e Anthropic a ripensare i loro modelli di business.
- Rende l’intelligenza artificiale di alta qualità più accessibile e conveniente.
- Ciò segnala la crescente presenza della Cina nello sviluppo dell’intelligenza artificiale all’avanguardia.
- Rafforza l’inevitabilità del progresso esponenziale nell’intelligenza artificiale.
Ancora più importante, il successo di DeepSeek dovrebbe servire a ricordare che lo sviluppo dell’AGI non riguarda solo il potenziamento dei trasformatori. Se miriamo davvero a costruire un’AGI a livello umano, dobbiamo andare oltre l’ottimizzazione dei modelli odierni e investire in approcci fondamentalmente nuovi.
La Singolarità sta arrivando rapidamente, ma se vogliamo che sia vantaggiosa, dobbiamo garantire che rimanga decentralizzata, globale e aperta. DeepSeek non è AGI, ma è un passo entusiasmante nella danza più ampia verso un futuro di intelligenza artificiale trasformativa.