Spanish English French German Italian Portuguese
marketing social
Iníciograndes tecnologiasAmazonAnthropic afirma que seus novos chatbots de IA superam o GPT-4

Anthropic afirma que seus novos chatbots de IA superam o GPT-4

A startup de IA Anthropic, apoiada pelo Google e centenas de milhões em capital de risco (e talvez em breve centenas de milhões a mais), anunciou a versão mais recente de sua tecnologia GenAI, Claude. E a empresa afirma que supera o chatbot da OpenAI, GPT-4, em termos de desempenho.

Claude 3, como é chamada a nova GenAI da Anthropic, é uma família de modelos: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus, sendo Opus o mais poderoso. Todos mostram “capacidades aumentadas” em análise e previsão, afirma a Anthropic, bem como melhor desempenho em benchmarks específicos em comparação com modelos como ChatGPT e GPT-4 (mas não GPT-4 Turbo) e Gemini 1.0 Ultra do Google (mas não Gemini 1.5 Pro ). .

Notavelmente, Claude 3 é o primeiro GenAI multimodal da Anthropic, o que significa que pode analisar texto e imagens, semelhante a algumas versões do GPT-4 e Gemini. Claude 3 pode processar fotografias, tabelas, gráficos e diagramas técnicos, extraindo arquivos PDF, apresentações de slides e outros tipos de documentos.

Num passo melhor do que alguns rivais da GenAI, o Claude 3 pode analisar múltiplas imagens em uma única solicitação (até um máximo de 20). Isso permite comparar e contrastar imagens, observa a Anthropic.

Mas o processamento de imagens de Claude 3 tem limites.

A Antrópica impediu que os modelos identificassem pessoas, sem dúvida cautelosos com as implicações éticas e legais. E a empresa admite que o Claude 3 está sujeito a erros com imagens de “baixa qualidade” (menos de 200 pixels) e tem problemas com tarefas que envolvem raciocínio espacial (por exemplo, ler o mostrador de um relógio analógico) e contagem de objetos. ( Claude 3 não pode fornecer dados exatos). contagens de objetos em imagens).

créditos: Antrópico

Nem Cláudio 3 vai gerar uma obra de arte. Os modelos analisam rigorosamente as imagens, pelo menos por enquanto.

Seja com texto ou imagens, a Anthropic afirma que os clientes podem esperar que o Claude 3 siga melhor as instruções em várias etapas e produza resultados estruturados em formatos como JSON e conversam em outros idiomas além do inglês em comparação com seus antecessores. Claude 3 também deveria se recusar a responder perguntas com menos frequência graças a uma “compreensão mais sutil das solicitações”, diz a Anthropic. E em breve, os modelos citarão a fonte de suas respostas às perguntas para que os usuários possam verificá-las.

“Claude 3 tende a gerar respostas mais expressivas e envolventes”, escreve a Anthropic em um artigo de apoio. “É mais fácil orientar e direcionar em comparação com nossos modelos legados. Os usuários deverão descobrir que podem alcançar os resultados desejados com instruções mais curtas e concisas.”

Algumas dessas melhorias vêm do contexto ampliado de Claude 3.

O contexto de um modelo, ou janela de contexto, refere-se aos dados de entrada (por exemplo, texto) que o modelo considera antes de gerar resultados. Modelos com pequenas janelas de contexto tendem a “esquecer” o conteúdo até mesmo de conversas muito recentes, levando-os a desviar-se do assunto, muitas vezes de forma problemática. Como vantagem adicional, os modelos ricos em contexto podem capturar melhor o fluxo narrativo de dados que recebem e gerar respostas contextualmente mais ricas (pelo menos hipoteticamente).

A Anthropic diz que Claude 3 suportará inicialmente uma janela de contexto de 200.000 tokens, equivalente a cerca de 150.000 palavras, e que clientes selecionados receberão uma janela de contexto de 1 milhão de tokens (~700.000 palavras). Isso está no mesmo nível do mais novo modelo GenAI do Google, o Gemini 1.5 Pro mencionado acima, que também oferece uma janela contextual de até um milhão de tokens.

Agora, só porque Claude 3 é uma atualização do que veio antes, não significa que seja perfeito.

Num documento técnico, A Anthropic admite que Claude 3 não está imune aos problemas que assolam outros modelos GenAI, nomeadamente preconceitos e alucinações (ou seja, inventar coisas). Ao contrário de alguns modelos GenAI, Claude 3 não pode pesquisar na web; os modelos só podem responder perguntas usando dados anteriores a agosto de 2023. E embora Claude seja multilíngue, ele não é tão fluente em certos idiomas de “baixa renda” como o inglês.

Mas atualizações promissoras da Anthropic para Claude 3 são esperadas nos próximos meses.

“Não acreditamos que a inteligência do modelo esteja perto dos seus limites e planeamos lançar melhorias para a família de modelos Claude 3 nos próximos meses”, escreve a empresa num comunicado. postagem do blog.

Opus e Sonnet agora estão disponíveis na web e por meio da API e console de desenvolvimento da Anthropic, da plataforma Bedrock da Amazon e do Vertex AI do Google. Haiku virá ainda este ano.

Aqui está o detalhamento dos preços:

  • Opus: US$ 15 por milhão de tokens de entrada, US$ 75 por milhão de tokens de saída
  • Soneto: US$ 3 por milhão de tokens de entrada, US$ 15 por milhão de tokens de saída
  • Haiku: US$ 0,25 por milhão de tokens recebidos, US$ 1,25 por milhão de tokens emitidos

Então é isso Claude 3. Mas o que é uma visão aérea?

A ambição da Anthropic é criar um algoritmo de próxima geração para “autoaprendizagem de IA”. Tal algoritmo poderia ser usado para criar assistentes virtuais que podem responder e-mails, realizar pesquisas e gerar arte, livros e muito mais, alguns dos quais já foram testados com empresas como GPT-4 e outros grandes modelos de linguagem.

A Anthropic sugere isso na postagem do blog mencionada, dizendo que planeja adicionar recursos ao Claude 3 que aprimoram seus recursos prontos para uso, permitindo que Claude interaja com outros sistemas, codifique “interativamente” e ofereça “agente avançado capacidades.” .”

Este último ponto nos lembra Comunicadoda OpenAI que visa criar um agente de software para automatizar tarefas complexas, como transferir dados de um documento para uma planilha ou preencher automaticamente relatórios de despesas e inseri-los em um software de contabilidade (por exemplo). OpenAI já oferece uma API que permite aos desenvolvedores criar “experiências semelhantes a agentes” em seus aplicativos, e a Anthropic pretende oferecer funcionalidade semelhante.

Poderíamos ver um imageador antrópico a seguir? Seria surpreendente. Os geradores de imagens são objeto de muita polêmica atualmente, principalmente por motivos relacionados a direitos autorais e preconceitos. Recentemente, o Google foi forçado a desativar seu gerador de imagens após injetar diversidade nas imagens com um ridículo desrespeito ao contexto histórico. E vários fornecedores de imagens estão em batalhas legais com artistas que os acusam de lucrar com o seu trabalho treinando a GenAI nesse trabalho sem oferecer compensação ou crédito.

Será interessante ver a evolução da técnica da Anthropic para treinar GenAI, “IA constitucional”, que, segundo a empresa, torna o comportamento de sua GenAI mais fácil de entender, mais previsível e mais fácil de ajustar conforme necessário. A IA Constitucional visa fornecer uma maneira de alinhar a IA com as intenções humanas, fazendo com que os modelos respondam a perguntas e executem tarefas usando um conjunto simples de princípios orientadores. Por exemplo, para Claude 3, a Anthropic disse que adicionou um princípio, baseado em feedback de crowdsourcing, que instrui os modelos a serem compreensivos e acessíveis às pessoas com deficiência.

Seja qual for o fim da Antrópico, será de longo prazo. De acordo com uma apresentação vazada em maio do ano passado, a empresa pretende arrecadar até US$ 5.000 bilhões nos próximos 12 meses, o que pode ser a base necessária para se manter competitiva com a OpenAI. Afinal, os modelos de treinamento não são baratos. Está a caminho, com 2 mil milhões de dólares e 4 mil milhões de dólares em capital comprometido pela Google e pela Amazon, respetivamente, e mais de mil milhões de dólares combinados de outros financiadores.

RELACIONADO

INSCREVA-SE NO TRPLANE.COM

Publicar no TRPlane.com

Se você tiver alguma história interessante sobre transformação, TI, digital, etc. com um lugar no TRPlane.com, envie para nós e compartilharemos com toda a Comunidade.

MAIS PUBLICAÇÕES

Ativar notificações OK Sem gracias