Claude 3, o desafiante do ChatGPT.

A Anthropic, startup fundada em 2021, pelos ex-membros seniores da OpenAI , os irmãos Daniela Amodei e Dario Amodei, tem obtido resultados relevantes na corrida pela IA. Desde a sua criação a empresa já arrecadou cerca de US$7 bilhões de empresas como Google e Amazon. Claro que os investimentos ainda não se comparam aos US$ 13 bilhões que a Microsoft colocou na OpenAI, mas colocam a empresa num patamar de alta competitividade, ainda mais após o  anúncio da sua mais nova criação, uma família de novos modelos de inteligência artificial, chamada de Claude 3. Essa novidade representa mais um avanço na corrida tecnológica que domina o Vale do Silício, onde empresas disputam incessantemente a liderança na comercialização de tecnologias cada vez mais poderosas.

Recentemente a família Claude 3 conseguiu importantes resultados no Chatbot Arena (https://chat.lmsys.org), plataforma livre no qual os usuários podem testar diferentes inteligências artificiais do mercado e comparar seus desempenhos. Além disso, é possível votar na ferramenta escolhida de melhor desempenho e trocar informações com os outros usuários. Para que possa avaliar a importância do feito, desde que o GPT-4 foi incluído no Chatbot Arena, por volta de 10 de maio de 2023, o modelo tinha consistentemente ocupado o topo da tabela até agora com a chegada da família Claude 3.

A família de modelos Claude 3 anunciada, estabelece novos padrões de referência no setor em uma ampla gama de tarefas cognitivas. A família inclui três modelos de última geração em ordem crescente de capacidade: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus. Cada modelo sucessivo oferece desempenho cada vez mais poderoso, permitindo que os usuários selecionem o equilíbrio ideal entre inteligência, velocidade e custo para sua aplicação específica.

O Modelo Opus supera seus concorrentes na maioria dos benchmarks de avaliação comuns para sistemas de IA, incluindo conhecimento especializado em nível de graduação (MMLU), raciocínio especializado em nível de pós-graduação (GPQA), matemática básica (GSM8K) e muito mais. Ele exibe níveis quase humanos de compreensão e fluência em tarefas complexas, liderando a fronteira da inteligência geral. Todos os modelos Claude 3 mostram capacidades aumentadas em análise e previsão, criação de conteúdo diferenciado, geração de código e conversação em idiomas diferentes do inglês, como espanhol, japonês e francês.

Abaixo segue uma comparação dos modelos Claude 3 com os principais concorrentes do mercado em vários benchmarks de capacidade:

Comparativo de Performance entre as Inteligências Arttificiais

Os modelos Claude 3 podem potencializar chats ao vivo com clientes, preenchimentos automáticos e tarefas de extração de dados onde as respostas devem ser imediatas e em tempo real. Também possuem capacidades de visão sofisticadas, equivalentes a outros modelos líderes e processam uma ampla variedade de formatos visuais, incluindo fotos, tabelas, gráficos e diagramas técnicos.

Dentro da família, o Claude 3 Opus é o modelo mais inteligente, com o melhor desempenho do mercado em tarefas altamente complexas. Ele pode navegar por prompts abertos e cenários invisíveis com notável fluência e compreensão humana. Dentre as características podemos destacar as seguintes:

Automação de tarefas: planeja e executa ações complexas em APIs e bancos de dados, codificação interativa.
P&D: revisão de pesquisas, brainstorming e geração de hipóteses, descoberta de medicamentos.
Estratégia: análise avançada de tabelas e gráficos, finanças e tendências de mercado, previsão.
Custo:  US$ 15 | US$ 75.
Diferencial: Maior inteligência do que qualquer outro modelo disponível.

O Claude 3 Sonnet, outro membro da família, atinge o equilíbrio ideal entre inteligência e velocidade, especialmente para cargas de trabalho corporativas. Ele oferece forte desempenho a um custo menor em comparação com seus concorrentes e foi projetado para alta resistência em implantações de IA em larga escala. Podemos destacar algumas características:

Processamento de dados: pesquisa e recuperação de grandes quantidades de conhecimento.
Vendas: recomendações de produtos, previsões, marketing direcionado.
Tarefas que economizam tempo: geração de código, controle de qualidade, análise de texto de imagens.
Custo:  US$ 3 | US$ 15.
Diferencial: Mais acessível que outros modelos com inteligência semelhante; melhor para escala.

Já o último, o Claude 3 Haiku é o modelo mais rápido e compacto para capacidade de resposta quase instantânea. Ele responde a dúvidas e solicitações simples com velocidade incomparável e  os usuários poderão construir experiências de IA perfeitas que imitam as interações humanas. Também podemos destacar algumas características:

Interações com clientes: suporte rápido e preciso em interações ao vivo, traduções.
Moderação de conteúdo: detecte comportamentos de risco ou solicitações de clientes.
Tarefas de economia de custos: logística otimizada, gerenciamento de estoque, extração de conhecimento de dados não estruturados.
Custo:  US$ 0,25 | US$ 1,25.
Diferencial: Mais inteligente, mais rápido e mais acessível do que outros modelos da sua categoria de inteligência.

O que podemos avaliar com esse avanço de outras soluções é que o mercado em breve contará com um número maior de possibilidades de novas inteligências artificiais, possibilitando uma maior liberdade de escolha para os usuários. Contudo, esse desenvolvimento deve ser acompanhado de perto pelas agências reguladoras para que as regras sejam cumpridas e possamos ter um conjunto de inteligências artificias éticas e com capacidade de solucionar problemas reais e positivos para a sociedade.

Escrito por:

Data:

Compartilhar: