O Impacto Crescente da DeepSeek no Mercado de IA
Recentemente, Anjney “Anj” Midha, sócio-gerente da Andreessen Horowitz e membro do conselho da Mistral, revelou ao TechCrunch que teve um primeiro contato impressionante com o desempenho do DeepSeek há cerca de seis meses.
Nesse período, a DeepSeek lançou o Coder V2, um modelo que competia diretamente com o GPT-4 Turbo da OpenAI em tarefas de codificação, conforme destacado em um artigo técnico publicado no ano passado. Desde então, a empresa tem se dedicado a lançar modelos melhorados a cada poucos meses, culminando no R1. Este último é um novo modelo de raciocínio de código aberto que está mudando a indústria tech, oferecendo desempenho padrão de mercado por um custo significativamente menor.
A Competitividade da DeepSeek e Seus Efeitos no Setor
Mesmo com a recente queda nas ações da Nvidia, que perdeu mais de 600 bilhões de dólares de sua capitalização de mercado devido ao crescimento da DeepSeek, Midha afirma que isso não significa que os modelos de IA deixarão de investir bilhões em chips GPU e na construção de novos centros de dados. “Isso implica que eles farão mais com o poder de computação que conseguirem obter”, diz ele.
Midha também explicou que, embora a Mistral tenha levantado um bilhão de dólares, isso não torna o investimento desnecessário. Ao contrário, é muito valioso para as empresas olharem para as melhorias de eficiência do DeepSeek e aplicá-las. “Agora conseguimos 10 vezes mais output com a mesma computação”, destacou.
O Papel da Mistral na Corrida da IA
Quando se trata de competir com rivais como OpenAI e Anthropic, que levantaram muito mais recursos financeiros, Midha garante que a Mistral ainda se destaca. “A Mistral é competitiva por ser um modelo de código aberto”, explicou. Além disso, o código aberto permite que a Mistral tenha acesso a uma mão de obra técnica praticamente gratuita de quem utiliza o projeto, enquanto os rivais de código fechado precisam pagar por toda a mão de obra e pelo poder computacional.
- A Mistral tem mais poder computacional do que qualquer outro fornecedor de código aberto.
- O Llama, modelo de IA de código aberto da Meta, receberá investimentos significativos para expansão.
- Mark Zuckerberg anunciou planos de gastar centenas de bilhões em IA, incluindo 60 bilhões somente em 2025 em despesas de capital.
Demanda por GPUs e o Programa Oxygen
Midha, que também é membro do conselho da Black Forest Labs e Luma, comentou sobre o crescente apetite da indústria de IA por GPUs sofisticadas, especialmente as H100 da Nvidia. Ele revelou que o programa Oxygen da a16z, que visa ajudar startups a suprir suas necessidades de computação, está “superreservado” no momento, indicando que a demanda por GPUs para treinamento de modelos de IA está muito além da oferta atual.
A demanda insaciável por inferências apenas aumentou. Ele observou que as inovações no DeepSeek não impactarão parcerias significativas, como a colaboração da OpenAI com a SoftBank e Oracle, avaliada em 500 bilhões de dólares para centros de dados de IA.
IA Como Infraestrutura Global
Midha também observa que os países estão começando a reconhecer que a IA é a próxima infraestrutura fundamental, assim como a eletricidade e a internet. Ele defende um conceito chamado de “independência de infraestrutura”, onde os países devem escolher entre depender de modelos chineses, que podem ter censura e controle sobre os dados, ou modelos ocidentais que seguem leis e acordos éticos.
Muitas empresas estão preocupadas com questões de segurança e já bloquearam o DeepSeek devido a temores relacionados à coleta de dados na China.
Conclusão e Desafios Futuros
Apesar das preocupações, muitas organizações ainda conseguem rodar modelos de IA open source localmente sem depender do serviço em nuvem do DeepSeek. Com isso, a flexibilidade e a segurança tornam-se prioridades. Até mesmo o ex-CEO da Intel, Pat Gelsinger, está desenvolvendo serviços de chat baseados em uma versão do DeepSeek em vez de alternativas como o Llama ou OpenAI.
No entanto, para aqueles que desejam se livrar de seus planos de centros de dados à luz do DeepSeek, Midha fez um pedido: “Se você tiver GPUs extras, por favor, envie-as para mim!”
“A IA é essencial para o futuro e as soluções devem ser rápidas e eficazes”, concluiu Midha.