logo

Global Soul Limited liyi@gs-smt.com 86-755-27962186

Global Soul Limited Perfil da empresa
Notícias
Para casa > Notícias >
Notícias da Empresa DeepSeek Apocalypse: gigante da IA queima bilhões de dólares, muito desperdiçado

DeepSeek Apocalypse: gigante da IA queima bilhões de dólares, muito desperdiçado

2025-02-25
Latest company news about DeepSeek Apocalypse: gigante da IA queima bilhões de dólares, muito desperdiçado

Em janeiro deste ano, a startup de inteligência artificial DeepSeek lançou duas inovações através de seu novo modelo R1, redefinindo silenciosamente a economia da inteligência artificial. Este modelo atinge o melhor desempenho a 1/40 do custo do modelo anterior. Em dezembro de 2024, o modelo de linguagem grande V3 da DeepSeek reduziu os custos de treinamento em mais de 90%.

Duas das inovações da DeepSeek atraíram ampla atenção: Primeiro, a DeepSeek revelou que pedir aos modelos de IA para elaborarem seus processos de raciocínio - uma abordagem de pesquisa conhecida como 'chain-of-thought prompting' - melhorou a precisão e a eficiência. Segundo, a DeepSeek usa inteligência artificial para gerar seus próprios conjuntos de dados, completamente independente da rotulagem manual dos dados. Embora haja argumentos de que a DeepSeek não é tão barata quanto afirma, essas inovações certamente inauguraram uma nova era na economia da IA.

A estrutura de custos da inteligência artificial está mudando dramaticamente. Cada dólar de aumento de desempenho teve um profundo impacto em startups, aplicações empresariais e investimentos em infraestrutura. Essa mudança pode derrubar as forças de mercado, ajudando, em última análise, startups ágeis a alcançar as gigantes de tecnologia no curto prazo, ao mesmo tempo em que impulsiona as margens de lucro.

As gigantes da tecnologia já investiram mais de US$ 100 bilhões no desenvolvimento de infraestrutura de IA, e esse valor continua a aumentar. Agora, elas devem considerar como gerar retorno sobre esses enormes investimentos e manter uma vantagem sobre algoritmos contra concorrentes de mercado menores e mais ágeis. Diante de um ambiente em rápida mudança, tanto as gigantes da tecnologia quanto as startups estão enfrentando um sinal claro: aproveitar a oportunidade do progresso tecnológico rapidamente ou ser eliminado.

A paisagem do mercado de IA antes e depois da DeepSeek

Antes da ascensão da DeepSeek, as startups lutavam para competir com os gastos em infraestrutura das gigantes da tecnologia, que investiam bilhões de dólares na construção de enormes data centers a cada trimestre e obtinham enormes vantagens com os avanços na tecnologia de inteligência artificial. Essas gigantes não apenas possuem enormes recursos de dados, mas também reúnem um grande número de talentos com doutorado, e o progresso dos algoritmos também depende de sua forte força técnica. Além disso, redes de distribuição estabelecidas permitem que elas movam produtos rapidamente para clientes existentes e acelerem o progresso tecnológico por meio de loops de feedback.

Hoje, no entanto, as startups são grandes o suficiente para competir com as gigantes da tecnologia. Somente em 2025, o custo do treinamento de modelos cairá 95%, reduzindo significativamente a vantagem de infraestrutura das gigantes da tecnologia. Os custos de raciocínio caíram quase mil vezes nos últimos três anos e devem cair ainda mais no futuro. A duração da vantagem algorítmica foi reduzida para 45 a 100 dias e pode continuar a diminuir.

Quando os custos de treinamento não são mais um gargalo fundamental, o desempenho de inferência (ou seja, o quão bem os modelos de IA funcionam em aplicações em tempo real) se torna um novo foco. Estamos entrando em uma nova fase: modelos menores e mais baratos que oferecem poder comparável a modelos maiores e podem ser executados em GPUs de menor desempenho, estendendo a vida útil de GPUs mais antigas. Se produtos de IA mais inteligentes puderem ser entregues a um custo muito baixo, as startups finalmente terão a chance de superar as gigantes da tecnologia, aumentando os lucros.

A alocação eficiente de mão de obra fortalece ainda mais a vantagem do desafiante. Sem a necessidade de contratar um grande número de talentos com nível de doutorado para montar uma equipe de IA competitiva, as startups podem desenvolver, otimizar e distribuir modelos a um custo muito menor do que as gigantes da tecnologia. E, como estão amplamente focadas no nível de aplicação, os desafiantes podem desfrutar de margens de lucro mais altas da mesma forma que as startups de nuvem ganharam uma vantagem ao melhorar a economia unitária há 15 anos.

Essa tendência não é boa apenas para startups. Também coloca empresas como a Nvidia em maior risco. Após o anúncio da DeepSeek, o preço das ações da Nvidia caiu 12%, embora desde então tenha se recuperado. Os riscos para os fabricantes de chips são maiores porque a demanda está mudando de hardware focado em treinamento para soluções de inferência mais eficientes. A ascensão das unidades de processamento neural (NPUs) de nível de consumidor pode acelerar essa mudança, permitindo que os modelos de IA sejam executados nativamente em dispositivos como smartphones e laptops.

Gastos com inteligência artificial

O que é bom para os desafiantes é ruim para as gigantes da tecnologia. As gigantes da IA quase instintivamente ligaram o domínio da DeepSeek a implicações de segurança nacional em uma tentativa de angariar apoio para o desenvolvimento de tecnologia semelhante, ignorando o fato de que pesquisadores dos EUA, incluindo os da Universidade de Stanford, conseguiram replicar e até mesmo superar a tecnologia da DeepSeek. Olhando para o futuro, as empresas que investem grandes somas em projetos de infraestrutura de dados podem perguntar: Os enormes gastos com pesquisa e desenvolvimento de modelos de IA foram desperdiçados? Se a tecnologia barata funcionar tão bem quanto a tecnologia cara, por que gastar tanto dinheiro?

As tendências históricas sugerem que a maioria dos avanços em IA realmente dependeu de investimento de capital excessivo em escala. A arquitetura Transformer foi bem-sucedida devido ao excesso de treinamento, excedendo o que era considerado algoritmicamente ideal na época. Novos avanços tecnológicos estão provando que podemos alcançar o mesmo desempenho a um custo menor. Embora soluções eficientes como a DeepSeek tenham melhorado significativamente a eficiência, mesmo assim, a expansão dos provedores de nuvem hiperscale ainda requer data centers maiores e deve arcar com os custos de inferência em expansão.

No entanto, as gigantes da tecnologia não estão paradas. Já estamos vendo uma corrida armamentista pelos feitos da DeepSeek, com modelos como o Gemini do Google, o Azure AI Foundry da Microsoft e o LLaMA de código aberto da Meta, todos competindo pela dominância. Modelos de código aberto podem desempenhar um papel fundamental. Mark Zuckerberg, CEO da Meta, enfatizou a importância da IA personalizada - ou seja, modelos adaptados às necessidades, cultura e preferências de usuários individuais. Essa visão se alinha com uma tendência mais ampla no desenvolvimento de IA: modelos menores e mais especializados, capazes de oferecer alto desempenho sem a necessidade de uma infraestrutura de nuvem massiva.

Startups ganham novos chips

Ao mesmo tempo, gigantes de código aberto e código fechado têm objetivos diferentes, aprimorando ainda mais a vantagem do desafiante. Modelos de código aberto criados por empresas como a Meta continuarão a competir e reduzir custos em todo o ecossistema, enquanto modelos de código fechado tentam cobrar taxas mais altas por meio de melhor tecnologia. As startups podem aproveitar a concorrência entre os dois campos para obter a melhor relação preço/desempenho para cada uso, aumentando as margens de lucro.

Independentemente do tamanho do negócio, a mensagem é clara: aproveite as vantagens específicas disponíveis para eles - dinâmica de mercado, poder de computação e talento - rapidamente ou enfrente o fracasso. O ciclo do progresso tecnológico está ficando mais curto, dos meses ou até anos que costumavam levar para estabelecer novos padrões de desempenho, para a inovação tecnológica da DeepSeek, sugerindo que agora pode levar apenas 41 dias. A inovação está avançando a uma taxa sem precedentes, e o espaço de tolerância a falhas está diminuindo rapidamente.

Eventos
Contactos
Contactos: Mr. Yi Lee
Fax: 86-0755-27678283
Contacte agora
Envia-nos.