Source article: DeepSeek and the Coming AI Cambrian Explosion | by the New SingularityNet | SingularityNET
Translation by: Log_tg
Dework task: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=41827cd7-e91c-49c4-8205-7acb9e48b52a
Community review: Please leave comments below about translation quality or like this post if it is well translated
DeepSeek и грядущий кембрийский взрыв ИИ
Статья д-ра Бена Герцеля
Генеральный директор Альянса искусственного суперинтеллекта
Волнение по поводу DeepSeek понятно, но многие реакции, которые я вижу, кажутся немного необоснованными. DeepSeek представляет собой значительный рост эффективности в области LLM, что окажет значительное влияние на природу и экономику приложений LLM. Однако это не сигнал о фундаментальном прорыве в области искусственного интеллекта общего назначения (AGI) или фундаментальном смещении центра тяжести инноваций в области ИИ. Это внезапный скачок по ожидаемой траектории, а не разрушительный сдвиг парадигмы.
Гонка по кривой эффективности
Впечатляющее достижение DeepSeek отражает более широкую историческую картину технологического прогресса. В начале 1990-х годов для рендеринга высококачественной компьютерной графики требовались суперкомпьютеры; теперь это делается на смартфонах. Распознавание лиц, когда-то дорогое нишевое приложение, теперь стало товарной функцией. Тот же принцип применим к большим языковым моделям (LLM). Удивляет не характер прогресса, а его скорость.
Для тех, кто следит за экспоненциальным технологическим ростом, это не шокирует. Концепция технологической сингулярности предсказывает ускорение изменений, особенно в областях автоматизированных открытий и изобретений, таких как ИИ. По мере приближения к сингулярности прорывы будут казаться все более стремительными. DeepSeek — лишь один из многих моментов в этом разворачивающемся мегатренде.
Архитектурные инновации DeepSeek: впечатляют, но не новы
Главное достижение DeepSeek заключается в оптимизации эффективности, а не в переопределении архитектуры ИИ. Его модель Mixture of Experts (MoE) — это новая модификация хорошо зарекомендовавшей себя методики ансамблевого обучения, которая использовалась в исследованиях ИИ в течение многих лет. Особенно хорошо DeepSeek удалось усовершенствовать MoE наряду с другими трюками повышения эффективности для минимизации вычислительных затрат:
- Эффективность параметров : конструкция MoE DeepSeek активирует только 37 миллиардов из 671 миллиарда параметров за раз. Это означает, что требуется всего 1/18 вычислительной мощности традиционных LLM.
- Обучение с подкреплением для рассуждений : вместо ручного проектирования модель R1 DeepSeek улучшает цепочку рассуждений посредством обучения с подкреплением.
- Многотокенное обучение : DeepSeek-V3 может предсказывать несколько фрагментов текста одновременно, повышая эффективность обучения.
Эти оптимизации позволяют моделям DeepSeek быть на порядок дешевле конкурентов вроде OpenAI или Anthropic, как для обучения, так и для вывода. Это не тривиальный подвиг — это важный шаг к тому, чтобы сделать высококачественные LLM более доступными. Но, опять же, это выдающееся инженерное усовершенствование, а не концептуальный скачок к AGI.
Общеизвестная сила открытого исходного кода
Одним из самых больших шагов DeepSeek является открытие исходного кода своей модели. Это резко контрастирует со стратегиями огороженного сада OpenAI, Anthropic и Google — и является реверансом в сторону Яна Лекуна из Meta. Открытый исходный код ИИ способствует быстрым инновациям, более широкому внедрению и коллективному совершенствованию. В то время как проприетарные модели позволяют фирмам получать больше прямых доходов, подход DeepSeek соответствует более децентрализованному будущему ИИ — такому, где инструменты доступны большему количеству исследователей, компаний и независимых разработчиков.
Хедж-фонд HighFlyer, стоящий за DeepSeek, знает, что открытый исходный код ИИ — это не только философия и благо для мира; это также хороший бизнес. OpenAI и Anthropic испытывают трудности с балансом между исследованиями и монетизацией. Решение DeepSeek открыть исходный код R1 свидетельствует об уверенности в другой экономической модели — основанной на услугах, корпоративной интеграции и масштабируемом хостинге. Это также дает мировому сообществу ИИ конкурентоспособный набор инструментов, ослабляя гегемонию американских крупных технологических компаний.
Роль Китая в гонке искусственного интеллекта
Некоторые на Западе были ошеломлены тем, что прорыв DeepSeek произошел в Китае. Я не так уж и удивлен. Проведя десятилетие в Китае, я своими глазами увидел масштаб инвестиций в исследования ИИ, растущее число докторов наук и пристальное внимание к тому, чтобы сделать ИИ мощным и экономически эффективным. Это не первый случай, когда Китай берет западную инновацию и быстро оптимизирует ее для эффективности и масштаба.
Однако вместо того, чтобы рассматривать это исключительно как геополитическое состязание, я вижу в этом шаг к более глобально интегрированному ландшафту ИИ. Полезный ИИ с гораздо большей вероятностью появится в результате открытого сотрудничества, чем из националистических бункеров. Децентрализованные, глобально распределенные усилия по разработке ИИ — а не монополия одной страны или корпорации — дают нам больше шансов на то, чтобы ИИ служил человечеству в целом.
Более широкие последствия DeepSeek: будущее за пределами LLM
Шумиха вокруг DeepSeek в основном сосредоточена на его экономической эффективности и влиянии на рынок LLM. Но сейчас, как никогда, нам действительно нужно сделать шаг назад и рассмотреть более широкую картину.
- LLM — это не будущее AGI
- Хотя модели на основе трансформаторов могут автоматизировать экономические задачи и интегрироваться в различные отрасли, им не хватает основных возможностей AGI, таких как обоснованная композиционная абстракция и самостоятельное рассуждение.
- Если в течение следующего десятилетия появится AGI, вряд ли он будет основан исключительно на трансформаторах. Альтернативные архитектуры, такие как OpenCog Hyperon и нейроморфные вычисления, могут оказаться более фундаментальными для достижения настоящего общего интеллекта.
- Коммерциализация LLM изменит инвестиции в ИИ
- Рост эффективности DeepSeek ускоряет тенденцию превращения LLM в товар. По мере снижения затрат инвесторы могут начать обращать взоры на следующий рубеж инноваций в области ИИ.
- Это может привлечь финансирование в архитектуры ИИ, выходящие за рамки трансформаторов, альтернативного оборудования ИИ (например, ассоциативных процессоров, нейроморфных чипов) и децентрализованных сетей ИИ.
- Децентрализация определит будущее ИИ
- Ландшафт ИИ смещается в сторону децентрализованных архитектур, в которых приоритет отдается конфиденциальности, совместимости и контролю со стороны пользователя.
- Повышение эффективности DeepSeek упрощает развертывание моделей ИИ в децентрализованных сетях, таких как SingularityNET и ASI Alliance, что снижает зависимость от централизованных технологических гигантов.
Роль DeepSeek в кембрийском взрыве ИИ
DeepSeek представляет собой важную веху в эффективности ИИ, но он не переписывает фундаментальную траекторию развития AGI. Это внезапное ускорение по предсказуемой кривой, а не смена парадигмы. Тем не менее, его влияние на экосистему ИИ значительно:
- Это заставляет таких игроков, как OpenAI и Anthropic, пересмотреть свои бизнес-модели.
- Это делает высококачественный ИИ более доступным и недорогим.
- Это свидетельствует о растущем присутствии Китая в передовых разработках в области искусственного интеллекта.
- Это подтверждает неизбежность экспоненциального прогресса в области ИИ.
Самое главное, успех DeepSeek должен служить напоминанием о том, что разработка AGI заключается не только в масштабировании трансформаторов. Если мы действительно стремимся создать AGI человеческого уровня, нам нужно выйти за рамки оптимизации сегодняшних моделей и инвестировать в принципиально новые подходы.
Сингулярность приближается быстро, но если мы хотим, чтобы она была полезной, мы должны гарантировать, что она останется децентрализованной, глобальной и открытой. DeepSeek — это не AGI, но это захватывающий шаг в более широком танце к преобразующему будущему ИИ.