
Anthropic Lança o Claude 3.7 Sonnet: A Revolução dos Modelos de IA Híbridos
A Anthropic anunciou o lançamento de um inovador modelo de inteligência artificial chamado Claude 3.7 Sonnet, projetado para “pensar” sobre questões pelo tempo desejado pelo usuário. Este modelo marca uma nova era na tecnologia de IA.
O Que Torna o Claude 3.7 Sonnet Único?
O Claude 3.7 Sonnet é descrito como o primeiro modelo de raciocínio híbrido da indústria. Essa inovação permite que ele forneça respostas tanto em tempo real quanto mais elaboradas e “pensadas”. Os usuários podem ativar as habilidades de raciocínio do modelo, permitindo que o Claude 3.7 Sonnet pense por períodos curtos ou longos.
Simplificando a Experiência do Usuário
O modelo reflete o esforço contínuo da Anthropic em simplificar a experiência do usuário. Normalmente, chatbots de IA oferecem seletores de modelo complexos, que requerem que os usuários escolham entre diversas opções de custo e capacidade. A Anthropic acredita que um único modelo deve ser capaz de realizar todas as funções necessárias sem complicações.
Segundo a empresa, o Claude 3.7 Sonnet estará acessível a todos os usuários e desenvolvedores a partir de segunda-feira. Todavia, apenas usuários dos planos premium do chatbot Claude terão acesso aos recursos completos de raciocínio do modelo. Usuários gratuitos terão acesso à versão padrão, que supera seu antecessor, o Claude 3.5 Sonnet. [TechCrunch]
Preços e Comparação com Outros Modelos
O custo do Claude 3.7 Sonnet é de 3 por milhão de tokens de entrada e 15 por milhão de tokens de saída, tornando-o mais caro que os modelos o3-mini da OpenAI e R1 da DeepSeek. Contudo, esses modelos são apenas de raciocínio, não híbridos como o Claude 3.7 Sonnet.
A Nova Abordagem de Raciocínio da Anthropic
O Claude 3.7 Sonnet é o primeiro da Anthropic a conseguir “raciocinar”, uma técnica que muitos laboratórios de IA vêm adotando em resposta aos limites dos métodos tradicionais de melhoria de desempenho da IA. [TechCrunch]
Modelos como o o3-mini e R1 dedicam mais tempo antes de responder, dividindo problemas em etapas menores para melhorar a precisão. Assim, mesmo que esses modelos não raciocinem como humanos, seu processo é baseado no raciocínio dedutivo.
Futuro do Raciocínio em IA
“Assim como os humanos não têm dois cérebros separados para questões simples e complexas”, declarou a Anthropic, “integramos o raciocínio com outras habilidades em um único modelo, em vez de separá-lo.”
A Anthropic visa permitir que o Claude decida autonomamente quanto tempo “pensar” sobre perguntas sem exigir controles manuais dos usuários.
Transparência no Processo de Raciocínio
A Anthropic implementou um “bloco de anotações visível” onde o Claude 3.7 Sonnet exibe seu processo interno de planejamento. Lee, da Anthropic, disse que os usuários terão visibilidade do processo de pensamento do Claude, embora algumas partes possam ser redigidas por razões de segurança.
Além disso, o Claude foi otimizado para tarefas do mundo real, como codificação complexa, permitindo que desenvolvedores ajustem o “orçamento” de pensamento, equilibrando velocidade, custo e qualidade da resposta.
Resultados de Testes e Inovações
Em testes práticos, o Claude 3.7 Sonnet mostrou resultados impressionantes, com uma precisão de 62,3% no SWE-Bench, superando o o3-mini da OpenAI. No teste TAU-Bench, que verifica a interação com usuários e APIs em ambientes de varejo, o modelo alcançou 81,2%, melhor que o o1 da OpenAI.
A Anthropic também afirma que o Claude 3.7 Sonnet rejeita menos perguntas que seus modelos anteriores, distinguindo melhor entre perguntas prejudiciais e benignas, reduzindo recusas desnecessárias em 45% comparado ao modelo Claude 3.5 Sonnet. [TechCrunch]
Apresentação do Claude Code
Além do Claude 3.7 Sonnet, a Anthropic está lançando o Claude Code, uma ferramenta de codificação que permite aos desenvolvedores executar tarefas diretamente do terminal. Em uma demonstração, a Anthropic exibiu como o Claude Code analisa e modifica códigos com comandos simples, podendo testar projetos ou enviá-los para o GitHub.
Inicialmente, o Claude Code será acessível a um número limitado de usuários com base na ordem de solicitação.
Um Lançamento em um Momento Crítico
O lançamento do Claude 3.7 Sonnet ocorre em um momento em que laboratórios de IA lançam novos modelos rapidamente. A Anthropic historicamente adota uma abordagem metódica e focada na segurança, mas agora busca liderar o setor.
A OpenAI também está próxima de lançar um modelo híbrido semelhante, previsto para os próximos meses. [TechCrunch]
FAQ
O que é o Claude 3.7 Sonnet?
O Claude 3.7 Sonnet é um modelo de inteligência artificial inovador criado pela Anthropic. Ele foi projetado para “pensar” de forma adaptativa e permite que os usuários determinem quanto tempo o modelo deve gastar em suas respostas. Esse lançamento representa uma nova era na tecnologia de IA, destacando-se pela sua capacidade de raciocínio híbrido.
Quais são as características únicas do Claude 3.7 Sonnet?
O Claude 3.7 Sonnet é o primeiro modelo de raciocínio híbrido da indústria, oferecendo respostas em tempo real e mais elaboradas. Os usuários podem ativar as habilidades de raciocínio para que o modelo pense tanto por períodos curtos quanto longos. Dessa forma, o usuário tem maior controle sobre a profundidade das respostas, ajustando a experiência conforme necessário.
Como a Anthropic simplifica a experiência do usuário?
A Anthropic busca simplificar a experiência do usuário ao evitar seletores de modelo complexos, comuns em outros chatbots de IA. Eles acreditam que um único modelo deve ser capaz de realizar todas as funções necessárias, eliminando a complicação de escolhas entre opções de custo e capacidade. Isso torna a interação com o Claude 3.7 Sonnet mais intuitiva.
Qual é a diferença de acesso entre usuários pagos e gratuitos no Claude 3.7 Sonnet?
Os usuários com planos premium do chatbot Claude terão acesso total aos recursos de raciocínio avançado do Claude 3.7 Sonnet. Por outro lado, os usuários gratuitos podem acessar uma versão padrão do modelo, que, mesmo assim, supera a performance de seu antecessor, o Claude 3.5 Sonnet.
Quais são os preços do Claude 3.7 Sonnet?
O custo do Claude 3.7 Sonnet é de 3 unidades monetárias por milhão de tokens de entrada e 15 por milhão de tokens de saída. Apesar de ser mais caro do que modelos como o o3-mini da OpenAI ou R1 da DeepSeek, a Anthropic destaca que seu modelo é híbrido, oferecendo uma abordagem mais integrada para o raciocínio.
Como o Claude 3.7 Sonnet melhora a precisão das respostas?
O Claude 3.7 Sonnet utiliza um processo de raciocínio que se destaca em testes práticos. Por exemplo, ele alcançou uma precisão de 62,3% no SWE-Bench, superando modelos anteriores. Essa abordagem permite que o modelo rejeite menos perguntas, distinguindo melhor entre questões prejudiciais e benignas, reduzindo recusas em 45% em comparação com seu antecessor.
Como funciona o bloco de anotações visível do Claude 3.7 Sonnet?
A Anthropic introduziu um “bloco de anotações visível” no Claude 3.7 Sonnet que permite aos usuários visualizarem o processo interno de planejamento do modelo. Essa transparência permite que os usuários compreendam melhor como as respostas são formadas, embora algumas partes possam ser redigidas por razões de segurança.
O que é o Claude Code e como ele funciona?
O Claude Code é uma ferramenta de codificação lançada pela Anthropic, permitindo que desenvolvedores executem tarefas diretamente do terminal. Durante demonstrações, a Anthropic mostrou como o Claude Code analisa e modifica códigos de forma simples e prática, facilitando testes e integrações com plataformas como o GitHub.
Qual é a abordagem da Anthropic em relação ao raciocínio em IA?
A Anthropic integra o raciocínio com outras habilidades em um único modelo, como o Claude 3.7 Sonnet. Essa estratégia visa garantir que o modelo decida autonomamente quanto tempo deve “pensar” sobre questões, sem depender de controles manuais dos usuários. Isso representa uma inovação no campo da IA, promovendo maior fluidez na interação.
Com informações: TechCrunch
Veja também: Perplexity Lança Navegador Comet em Meio a Desafios no Mercado de IA