Source article: DeepSeek and the Coming AI Cambrian Explosion | by the New SingularityNet | SingularityNET
Translation by: apex
Dework task: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=516808b2-31ef-4b51-b540-468cd65e42f6
Community review: Please leave comments below about translation quality or like this post if it is well translated
DeepSeek et l’explosion cambrienne de l’IA à venir
Par SingularityNET
21 février 2025
Contenu
Article du Dr Ben Goertzel
PDG, Alliance pour la superintelligence artificielle
L’engouement suscité par DeepSeek est compréhensible, mais nombre des réactions que je constate me semblent quelque peu infondées. DeepSeek représente un gain d’efficacité significatif dans le domaine du LLM, ce qui aura un impact majeur sur la nature et la rentabilité des candidatures. Cependant, il ne marque pas une avancée majeure en intelligence artificielle générale (IAG), ni un déplacement fondamental du centre de gravité de l’innovation en IA. Il s’agit d’un bond en avant sur une trajectoire attendue plutôt que d’un changement de paradigme disruptif.
Course le long de la courbe d’efficacité
L’impressionnante réussite de DeepSeek reflète le modèle historique plus large de progression technologique. Au début des années 1990, le rendu graphique informatique haut de gamme nécessitait des supercalculateurs ; aujourd’hui, il est réalisé sur smartphones. La reconnaissance faciale, autrefois une application de niche coûteuse, est désormais une fonctionnalité courante. Le même principe s’applique aux grands modèles de langage (LLM). La surprise ne réside pas dans la nature de l’avancée, mais dans sa rapidité.
Pour ceux qui s’intéressent à la croissance technologique exponentielle, cela n’a rien de surprenant. Le concept de Singularité Technologique prédit une accélération des changements, notamment dans les domaines de la découverte et de l’invention automatisées comme l’IA. À mesure que nous approchons de la Singularité, les avancées technologiques sembleront de plus en plus rapides. DeepSeek n’est qu’un exemple parmi d’autres de cette mégatendance en cours.
Les innovations architecturales de DeepSeek : impressionnantes, mais pas nouvelles
La principale réussite de DeepSeek réside dans l’optimisation de l’efficacité plutôt que dans la redéfinition de l’architecture de l’IA. Son modèle de mélange d’experts (MoE) est une nouvelle version améliorée d’une technique d’apprentissage d’ensemble bien établie, utilisée depuis des années en recherche en IA. DeepSeek a particulièrement réussi à affiner le MoE, ainsi que d’autres astuces d’efficacité, afin de minimiser les coûts de calcul :
- Efficacité des paramètres : La conception MoE de DeepSeek n’active que 37 milliards de ses 671 milliards de paramètres à la fois. Cela signifie qu’elle ne nécessite que 1/18e de la puissance de calcul des LLM traditionnels.
- Apprentissage par renforcement pour le raisonnement : au lieu de l’ingénierie manuelle, le modèle R1 de DeepSeek améliore le raisonnement par chaîne de pensée via l’apprentissage par renforcement.
- Formation multi-jetons : DeepSeek-V3 peut prédire plusieurs morceaux de texte à la fois, augmentant ainsi l’efficacité de la formation.
Ces optimisations permettent aux modèles DeepSeek d’être considérablement moins chers que ceux de concurrents comme OpenAI ou Anthropic, tant pour l’entraînement que pour l’inférence. Ce n’est pas une mince affaire : c’est une avancée majeure vers l’accessibilité des LLM de haute qualité. Mais encore une fois, il s’agit d’une avancée technique remarquable, et non d’un bond conceptuel vers l’IA générale.
Le pouvoir bien connu de l’Open Source
L’une des initiatives majeures de DeepSeek est de rendre son modèle open source. Ce modèle contraste fortement avec les stratégies cloisonnées d’OpenAI, d’Anthropic et de Google, et constitue un clin d’œil à Yann LeCun de Meta. L’IA open source favorise l’innovation rapide, une adoption plus large et l’amélioration collective. Si les modèles propriétaires permettent aux entreprises de générer davantage de revenus directs, l’approche de DeepSeek s’inscrit dans une perspective d’IA plus décentralisée, où les outils seront accessibles à davantage de chercheurs, d’entreprises et de développeurs indépendants.
Le fonds spéculatif HighFlyer, à l’origine de DeepSeek, sait que l’IA open source n’est pas seulement une question de philosophie et de bien-être mondial ; c’est aussi une bonne affaire. OpenAI et Anthropic peinent à concilier recherche et monétisation. La décision de DeepSeek d’ouvrir R1 en open source témoigne de sa confiance dans un modèle économique différent, basé sur les services, l’intégration d’entreprise et l’hébergement évolutif. Elle offre également à la communauté mondiale de l’IA un ensemble d’outils compétitifs, réduisant ainsi l’emprise des géants technologiques américains.
Le rôle de la Chine dans la course à l’IA
Certains en Occident ont été surpris que la percée de DeepSeek vienne de Chine. Je ne suis pas si surpris. Ayant passé dix ans en Chine, j’ai pu constater de visu l’ampleur des investissements dans la recherche en IA, le nombre croissant de doctorats et l’intense volonté de rendre l’IA à la fois puissante et rentable. Ce n’est pas la première fois que la Chine s’empare d’une innovation occidentale et l’optimise rapidement pour en optimiser l’efficacité et l’évolutivité.
Cependant, plutôt que de considérer cela uniquement comme une compétition géopolitique, je le vois comme une étape vers un paysage de l’IA plus intégré à l’échelle mondiale. Une IAG bénéfique a bien plus de chances de naître d’une collaboration ouverte que de cloisonnements nationalistes. Un effort de développement d’IAAG décentralisé et distribué à l’échelle mondiale – plutôt qu’un monopole d’un seul pays ou d’une seule entreprise – nous donne de meilleures chances de garantir que l’IA serve l’humanité toute entière.
Les implications plus larges de DeepSeek : l’avenir au-delà des LLM
L’engouement autour de DeepSeek repose principalement sur sa rentabilité et son impact sur le marché du LLM. Mais aujourd’hui plus que jamais, il est essentiel de prendre du recul et d’envisager la situation dans son ensemble.
- Les LLM ne sont pas l’avenir de l’AGI
- Bien que les modèles basés sur des transformateurs puissent automatiser les tâches économiques et s’intégrer dans diverses industries, ils manquent de capacités AGI de base telles que l’abstraction compositionnelle fondée et le raisonnement autodirigé.
- Si l’AGI émerge au cours de la prochaine décennie, il est peu probable qu’elle soit uniquement basée sur les transformateurs. Des architectures alternatives, comme OpenCog Hyperon et l’informatique neuromorphique, pourraient s’avérer plus fondamentales pour parvenir à une véritable intelligence générale.
- La banalisation des LLM va modifier les investissements dans l’IA
- Les gains d’efficacité de DeepSeek accélèrent la généralisation des LLM. Avec la baisse des coûts, les investisseurs pourraient commencer à s’intéresser aux prochaines avancées en matière d’innovation en IA.
- Cela pourrait conduire à un financement vers des architectures AGI au-delà des transformateurs, du matériel d’IA alternatif (par exemple, des unités de traitement associatif, des puces neuromorphiques) et des réseaux d’IA décentralisés.
- La décentralisation façonnera l’avenir de l’IA
- Le paysage de l’IA évolue vers des architectures décentralisées qui privilégient la confidentialité, l’interopérabilité et le contrôle des utilisateurs.
- Les gains d’efficacité de DeepSeek facilitent le déploiement de modèles d’IA dans des réseaux décentralisés, comme ceux de SingularityNET et de l’ASI Alliance, réduisant ainsi la dépendance aux géants technologiques centralisés.
Le rôle de DeepSeek dans l’explosion cambrienne de l’IA
DeepSeek représente une étape majeure dans l’efficacité de l’IA, mais ne bouleverse pas la trajectoire fondamentale du développement de l’IAG. Il s’agit d’une accélération soudaine le long d’une courbe prévisible, et non d’un changement de paradigme. Son impact sur l’écosystème de l’IA est néanmoins significatif :
- Cela oblige les acteurs historiques comme OpenAI et Anthropic à repenser leurs modèles économiques.
- Cela rend l’IA de haute qualité plus accessible et plus abordable.
- Cela témoigne de la présence croissante de la Chine dans le développement de l’IA de pointe.
- Cela renforce l’inévitabilité des progrès exponentiels de l’IA.
Plus important encore, le succès de DeepSeek devrait nous rappeler que le développement de l’IAG ne se limite pas à la mise à l’échelle des transformateurs. Si nous souhaitons véritablement créer une IAG à l’échelle humaine, nous devons aller au-delà de l’optimisation des modèles actuels et investir dans des approches fondamentalement nouvelles.
La Singularité arrive à grands pas, mais si nous voulons qu’elle soit bénéfique, nous devons veiller à ce qu’elle reste décentralisée, mondiale et ouverte. DeepSeek n’est pas une IAG, mais c’est une étape passionnante vers un avenir transformateur de l’IA.