Russian - DeepSeek and the Coming AI Cambrian Explosion

Source article: DeepSeek and the Coming AI Cambrian Explosion | by the New SingularityNet | SingularityNET
Translation by: Log_tg
Dework task: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=41827cd7-e91c-49c4-8205-7acb9e48b52a
Community review: Please leave comments below about translation quality or like this post if it is well translated

DeepSeek и грядущий кембрийский взрыв ИИ

Статья д-ра Бена Герцеля

Генеральный директор Альянса искусственного суперинтеллекта

Волнение по поводу DeepSeek понятно, но многие реакции, которые я вижу, кажутся немного необоснованными. DeepSeek представляет собой значительный рост эффективности в области LLM, что окажет значительное влияние на природу и экономику приложений LLM. Однако это не сигнал о фундаментальном прорыве в области искусственного интеллекта общего назначения (AGI) или фундаментальном смещении центра тяжести инноваций в области ИИ. Это внезапный скачок по ожидаемой траектории, а не разрушительный сдвиг парадигмы.

Гонка по кривой эффективности

Впечатляющее достижение DeepSeek отражает более широкую историческую картину технологического прогресса. В начале 1990-х годов для рендеринга высококачественной компьютерной графики требовались суперкомпьютеры; теперь это делается на смартфонах. Распознавание лиц, когда-то дорогое нишевое приложение, теперь стало товарной функцией. Тот же принцип применим к большим языковым моделям (LLM). Удивляет не характер прогресса, а его скорость.

Для тех, кто следит за экспоненциальным технологическим ростом, это не шокирует. Концепция технологической сингулярности предсказывает ускорение изменений, особенно в областях автоматизированных открытий и изобретений, таких как ИИ. По мере приближения к сингулярности прорывы будут казаться все более стремительными. DeepSeek — лишь один из многих моментов в этом разворачивающемся мегатренде.

Архитектурные инновации DeepSeek: впечатляют, но не новы

Главное достижение DeepSeek заключается в оптимизации эффективности, а не в переопределении архитектуры ИИ. Его модель Mixture of Experts (MoE) — это новая модификация хорошо зарекомендовавшей себя методики ансамблевого обучения, которая использовалась в исследованиях ИИ в течение многих лет. Особенно хорошо DeepSeek удалось усовершенствовать MoE наряду с другими трюками повышения эффективности для минимизации вычислительных затрат:

  • Эффективность параметров : конструкция MoE DeepSeek активирует только 37 миллиардов из 671 миллиарда параметров за раз. Это означает, что требуется всего 1/18 вычислительной мощности традиционных LLM.
  • Обучение с подкреплением для рассуждений : вместо ручного проектирования модель R1 DeepSeek улучшает цепочку рассуждений посредством обучения с подкреплением.
  • Многотокенное обучение : DeepSeek-V3 может предсказывать несколько фрагментов текста одновременно, повышая эффективность обучения.

Эти оптимизации позволяют моделям DeepSeek быть на порядок дешевле конкурентов вроде OpenAI или Anthropic, как для обучения, так и для вывода. Это не тривиальный подвиг — это важный шаг к тому, чтобы сделать высококачественные LLM более доступными. Но, опять же, это выдающееся инженерное усовершенствование, а не концептуальный скачок к AGI.

Общеизвестная сила открытого исходного кода

Одним из самых больших шагов DeepSeek является открытие исходного кода своей модели. Это резко контрастирует со стратегиями огороженного сада OpenAI, Anthropic и Google — и является реверансом в сторону Яна Лекуна из Meta. Открытый исходный код ИИ способствует быстрым инновациям, более широкому внедрению и коллективному совершенствованию. В то время как проприетарные модели позволяют фирмам получать больше прямых доходов, подход DeepSeek соответствует более децентрализованному будущему ИИ — такому, где инструменты доступны большему количеству исследователей, компаний и независимых разработчиков.

Хедж-фонд HighFlyer, стоящий за DeepSeek, знает, что открытый исходный код ИИ — это не только философия и благо для мира; это также хороший бизнес. OpenAI и Anthropic испытывают трудности с балансом между исследованиями и монетизацией. Решение DeepSeek открыть исходный код R1 свидетельствует об уверенности в другой экономической модели — основанной на услугах, корпоративной интеграции и масштабируемом хостинге. Это также дает мировому сообществу ИИ конкурентоспособный набор инструментов, ослабляя гегемонию американских крупных технологических компаний.

Роль Китая в гонке искусственного интеллекта

Некоторые на Западе были ошеломлены тем, что прорыв DeepSeek произошел в Китае. Я не так уж и удивлен. Проведя десятилетие в Китае, я своими глазами увидел масштаб инвестиций в исследования ИИ, растущее число докторов наук и пристальное внимание к тому, чтобы сделать ИИ мощным и экономически эффективным. Это не первый случай, когда Китай берет западную инновацию и быстро оптимизирует ее для эффективности и масштаба.

Однако вместо того, чтобы рассматривать это исключительно как геополитическое состязание, я вижу в этом шаг к более глобально интегрированному ландшафту ИИ. Полезный ИИ с гораздо большей вероятностью появится в результате открытого сотрудничества, чем из националистических бункеров. Децентрализованные, глобально распределенные усилия по разработке ИИ — а не монополия одной страны или корпорации — дают нам больше шансов на то, чтобы ИИ служил человечеству в целом.

Более широкие последствия DeepSeek: будущее за пределами LLM

Шумиха вокруг DeepSeek в основном сосредоточена на его экономической эффективности и влиянии на рынок LLM. Но сейчас, как никогда, нам действительно нужно сделать шаг назад и рассмотреть более широкую картину.

  1. LLM — это не будущее AGI
  • Хотя модели на основе трансформаторов могут автоматизировать экономические задачи и интегрироваться в различные отрасли, им не хватает основных возможностей AGI, таких как обоснованная композиционная абстракция и самостоятельное рассуждение.
  • Если в течение следующего десятилетия появится AGI, вряд ли он будет основан исключительно на трансформаторах. Альтернативные архитектуры, такие как OpenCog Hyperon и нейроморфные вычисления, могут оказаться более фундаментальными для достижения настоящего общего интеллекта.
  1. Коммерциализация LLM изменит инвестиции в ИИ
  • Рост эффективности DeepSeek ускоряет тенденцию превращения LLM в товар. По мере снижения затрат инвесторы могут начать обращать взоры на следующий рубеж инноваций в области ИИ.
  • Это может привлечь финансирование в архитектуры ИИ, выходящие за рамки трансформаторов, альтернативного оборудования ИИ (например, ассоциативных процессоров, нейроморфных чипов) и децентрализованных сетей ИИ.
  1. Децентрализация определит будущее ИИ
  • Ландшафт ИИ смещается в сторону децентрализованных архитектур, в которых приоритет отдается конфиденциальности, совместимости и контролю со стороны пользователя.
  • Повышение эффективности DeepSeek упрощает развертывание моделей ИИ в децентрализованных сетях, таких как SingularityNET и ASI Alliance, что снижает зависимость от централизованных технологических гигантов.

Роль DeepSeek в кембрийском взрыве ИИ

DeepSeek представляет собой важную веху в эффективности ИИ, но он не переписывает фундаментальную траекторию развития AGI. Это внезапное ускорение по предсказуемой кривой, а не смена парадигмы. Тем не менее, его влияние на экосистему ИИ значительно:

  • Это заставляет таких игроков, как OpenAI и Anthropic, пересмотреть свои бизнес-модели.
  • Это делает высококачественный ИИ более доступным и недорогим.
  • Это свидетельствует о растущем присутствии Китая в передовых разработках в области искусственного интеллекта.
  • Это подтверждает неизбежность экспоненциального прогресса в области ИИ.

Самое главное, успех DeepSeek должен служить напоминанием о том, что разработка AGI заключается не только в масштабировании трансформаторов. Если мы действительно стремимся создать AGI человеческого уровня, нам нужно выйти за рамки оптимизации сегодняшних моделей и инвестировать в принципиально новые подходы.

Сингулярность приближается быстро, но если мы хотим, чтобы она была полезной, мы должны гарантировать, что она останется децентрализованной, глобальной и открытой. DeepSeek — это не AGI, но это захватывающий шаг в более широком танце к преобразующему будущему ИИ.