Portuguese - DeepSeek and the Coming AI Cambrian Explosion

Source article: DeepSeek and the Coming AI Cambrian Explosion | by the New SingularityNet | SingularityNET
Translation by: Han TutuH
Dework task: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=f0fd9a48-d2ef-4e4c-8f3e-0e5ea4d42197
Community review: Please leave comments below about translation quality or like this post if it is well translated

DeepSeek e a próxima explosão cambriana de IA

Conteúdo

Dr. Ben Goertzel’in lê

CEO, Aliança de Superinteligência Artificial

A empolgação com o DeepSeek é compreensível – mas a maioria das reações que vi parecem bastante descabidas. DeepSeek representa um ganho de eficiência significativo no campo LLM, que terá um grande impacto na natureza e na economia das práticas de LLM. No entanto, não marca um avanço fundamental na inteligência artificial geral (AGI) ou uma mudança fundamental no centro de gravidade da inovação em IA. Em vez de uma mudança disruptiva de paradigma, trata-se de um salto repentino numa trajetória esperada.

Corra ao longo da curva de produtividade

O impressionante sucesso do DeepSeek reflete o padrão histórico mais amplo do progresso tecnológico. No início da década de 1990, a criação de computação gráfica de ponta exigia supercomputadores; Agora, isso é feito em smartphones. O reconhecimento facial, que já foi um aplicativo de nicho caro, agora é um recurso comum. O mesmo princípio se aplica a grandes modelos de linguagem (LLMs). A surpresa não é a natureza do progresso, mas a velocidade.

Isto não é surpresa para aqueles que prestam atenção ao crescimento tecnológico exponencial. O conceito de Singularidade Tecnológica prevê a aceleração da mudança, especialmente nas áreas de descoberta e invenção automatizadas, como a inteligência artificial. À medida que nos aproximamos da singularidade, os avanços aparecerão cada vez mais rápido. DeepSeek é apenas um dos muitos momentos desta megatendência em evolução.

Inovações arquitetônicas da DeepSeek: impressionantes, mas não novas

O principal sucesso do DeepSeek reside na otimização da eficiência, em vez de na redefinição da arquitetura de IA. O modelo Mixture of Experts (MoE) é um novo ajuste de uma técnica de aprendizagem em conjunto bem estabelecida que tem sido usada em pesquisas de IA há anos. O que o DeepSeek fez particularmente bem foi melhorar o MoE junto com outros truques de eficiência para minimizar os custos computacionais:

  • Eficiência de parâmetros: O design MoE do DeepSeek ativa apenas 37 bilhões de seus 671 bilhões de parâmetros simultaneamente. Isso significa que eles exigem apenas 1/18 do poder computacional dos LLMs tradicionais.
  • Aprendizado por reforço para raciocínio: o modelo R1 do DeepSeek melhora o raciocínio da cadeia de pensamento por meio de aprendizado por reforço em vez de engenharia manual.
  • Treinamento Multi-Token: DeepSeek-V3 pode prever vários trechos de texto simultaneamente, melhorando assim a eficiência do treinamento.

Essas otimizações tornam os modelos DeepSeek muito mais baratos que concorrentes como OpenAI ou Anthropic, tanto em termos de treinamento quanto de inferência. Isso não é pouca coisa; um grande passo para tornar os LLMs de alta qualidade mais acessíveis. Mesmo assim, este é um avanço estelar da engenharia, não um salto conceitual em direção à AGI.

O poder conhecido do software de código aberto

Um dos maiores movimentos do DeepSeek é abrir o código de seu modelo. Isso contrasta fortemente com as estratégias de jardins murados da OpenAI, Anthropic e Google, e é uma homenagem a Yann LeCun da Meta. A IA de código aberto promove inovação rápida, adoção mais ampla e melhoria coletiva. Embora os modelos proprietários permitam que as empresas gerem receitas mais diretas, a abordagem da DeepSeek está alinhada com um futuro de IA mais descentralizado; Um futuro onde as ferramentas possam ser usadas por mais pesquisadores, empresas e desenvolvedores independentes.

HighFlyer, o fundo de hedge por trás do DeepSeek, argumenta que a IA de código aberto não se trata apenas de filosofia e de fazer coisas boas para o mundo; Ele também sabe que é um bom trabalho. OpenAI e Anthropic estão lutando para equilibrar pesquisa e monetização. A decisão da DeepSeek de abrir o código R1 demonstra confiança em um modelo econômico diferente baseado em serviços, integração empresarial e hospedagem escalável. Também reduz a influência da hegemonia da Big Tech americana, fornecendo um conjunto de ferramentas competitivo para a comunidade global de IA.

O papel da China na corrida pela inteligência artificial

Algumas pessoas no Ocidente ficaram surpresas com o fato de a descoberta do DeepSeek ter vindo da China. Não estou muito surpreso. Tendo passado uma década na China, testemunhei em primeira mão a escala do investimento na investigação em IA, o número crescente de doutoramentos e o foco intenso em tornar a IA poderosa e rentável. Esta não é a primeira vez que a China pega numa inovação do Ocidente e otimiza-a rapidamente para eficiência e escala.

No entanto, em vez de ver isto apenas como uma luta geopolítica, vejo-o como um passo em direcção a um cenário de IA mais integrado a nível global. É muito mais provável que a AGI benéfica surja de uma colaboração aberta e não de silos nacionalistas. Os esforços para desenvolver uma AGI descentralizada e distribuída globalmente, em vez do monopólio de um único país ou empresa, dão-nos uma melhor oportunidade de garantir que a IA sirva toda a humanidade.

Implicações mais amplas do DeepSeek: o futuro além dos LLMs

O entusiasmo em torno do DeepSeek concentra-se principalmente em sua relação custo-benefício e impacto no mercado de LLM. Mas agora, mais do que nunca, precisamos de dar um passo atrás e considerar o panorama geral.

  1. LLMs não são o futuro da AGI
  • Embora os modelos baseados em transformadores possam automatizar tarefas econômicas e integrar-se a vários setores, eles carecem de recursos básicos de AGI, como abstração composicional integrada e raciocínio autodirigido.
  • Se a AGI surgir na próxima década, é pouco provável que seja inteiramente baseada em transformadores. Arquiteturas alternativas, como OpenCog Hyperon e computação neuromórfica, podem ser mais fundamentais para alcançar a verdadeira inteligência geral.
  1. A mercantilização de LLMs mudará o investimento em inteligência artificial
  • Os ganhos de eficiência do DeepSeek aceleram a tendência de os LLMs se tornarem uma commodity. À medida que os custos diminuem, os investidores podem começar a olhar para a próxima fronteira da inovação em IA.
  • Isto poderia financiar arquiteturas AGI além de transformadores, hardware alternativo de IA (por exemplo, unidades de processamento relacional, chips neuromórficos) e redes descentralizadas de IA.
  1. A descentralização moldará o futuro da inteligência artificial
  • O campo da IA ​​está mudando para arquiteturas descentralizadas que priorizam a privacidade, a interoperabilidade e o controle do usuário.
  • Os ganhos de eficiência do DeepSeek facilitam a implantação de modelos de IA em redes descentralizadas como SingularityNET e ASI Alliance, reduzindo a dependência de gigantes da tecnologia centralizados.

O papel do DeepSeek na explosão cambriana da inteligência artificial

DeepSeek representa um grande avanço na eficiência da IA, mas não reescreve a trajetória fundamental do desenvolvimento da AGI. Uma aceleração repentina ao longo de uma curva previsível não é uma mudança de paradigma. Ainda assim, o seu impacto no ecossistema de IA é significativo:

  • Isso pressiona empresas existentes, como OpenAI e Anthropic, a repensar seus modelos de negócios.
  • Torna a IA de alta qualidade mais acessível e acessível.
  • Isto mostra que a presença da China no domínio do desenvolvimento avançado da inteligência artificial está a aumentar.
  • Reforça a inevitabilidade do progresso exponencial na inteligência artificial.

Mais importante ainda, o sucesso do DeepSeek deve servir como um lembrete de que o desenvolvimento de AGI não envolve apenas dimensionar transdutores. Se realmente pretendemos construir uma AGI a nível humano, devemos ir além da otimização dos modelos atuais e investir em abordagens fundamentalmente novas.

A singularidade está a chegar rapidamente – mas se quisermos que seja útil, temos de garantir que permanece descentralizada, global e aberta. DeepSeek não é AGI, mas é um passo emocionante em uma dança mais ampla em direção a um futuro transformador de IA.