Claude (modelo de linguagem)

Claude
Claude (modelo de linguagem)
Desenvolvedor	Anthropic
Plataforma	Navegador, Android e iOS
Lançamento	Março de 2023
Gênero(s)	Modelo de linguagem grande Chatbot
Licença	Proprietário
Estado do desenvolvimento	Ativo
Página oficial	claude.ai

Claude é uma família de grandes modelos de linguagem desenvolvidos pela Anthropic.^[1] O primeiro modelo foi lançado em março de 2023. Claude 3, lançado em março de 2024, também pode analisar imagens.^[2]

Treinamento

Os modelos Claude são transformadores generativos pré-treinados. Eles foram pré-treinados para prever a próxima palavra em grandes quantidades de texto. Os modelos de Claude foram então ajustados com IA constitucional com o objetivo de torná-los úteis, honestos e inofensivos.^[3]^[4]

IA constitucional

IA constitucional é uma abordagem desenvolvida pela Anthropic para treinar sistemas de IA, particularmente modelos de linguagem como Claude, para serem inofensivos e úteis sem depender de amplo feedback humano. O método, detalhado no artigo "Constitutional AI: Harmlessness from AI Feedback" envolve duas fases: aprendizagem supervisionada e aprendizagem por reforço.^[4]

Na fase de aprendizagem supervisionada, o modelo gera respostas a prompts, autocrítica essas respostas com base em um conjunto de princípios orientadores (uma "constituição") e revisa as respostas. O modelo é então ajustado com base nessas respostas revisadas.^[4]

Para a fase de aprendizado por reforço do feedback da IA (RLAIF), as respostas são geradas e uma IA compara sua conformidade com a constituição. Este conjunto de dados de feedback de IA é usado para treinar um modelo de preferência que avalia as respostas com base em quanto elas satisfazem a constituição. Claude é então ajustado para se alinhar a esse modelo de preferência. Esta técnica é semelhante à aprendizagem por reforço a partir do feedback humano (RLHF), exceto que as comparações usadas para treinar o modelo de preferência são geradas por IA e são baseadas na constituição.^[5]^[4]

Esta abordagem permite a formação de assistentes de IA que sejam úteis e inofensivos, e que possam explicar as suas objeções a pedidos prejudiciais, aumentando a transparência e reduzindo a dependência da supervisão humana.^[6]^[7]

A “constituição” para Claude inclui 75 pontos, incluindo seções da Declaração Universal dos Direitos Humanos da ONU.^[6]^[3]

Modelos

O nome Claude foi notavelmente inspirado por Claude Shannon, um pioneiro em inteligência artificial.^[8]

Claude

Claude foi a versão inicial do modelo de linguagem da Anthropic lançada em março de 2023,^[9] Claude demonstrou proficiência em várias tarefas, mas tinha certas limitações em capacidades de codificação, matemática e raciocínio.^[10] A Anthropic fez parcerias com empresas como a Notion (software de produtividade) e a Quora (para ajudar a desenvolver o chatbot Poe).^[10]

Claude Instant

O Claude foi lançado em duas versões, Claude e Claude Instant, sendo o Claude Instant uma versão mais rápida, menos cara e mais leve. Claude Instant tem um comprimento de contexto de entrada de 100.000 tokens (o que corresponde a cerca de 75.000 palavras).^[11]

Claude 2

Claude 2 foi a próxima grande iteração do Claude, que foi lançado em julho de 2023 e estava disponível para o público em geral, enquanto o Claude 1 estava disponível apenas para usuários selecionados aprovados pela Anthropic.^[12]

Claude 2 expandiu sua janela de contexto de 9.000 tokens para 100.000 tokens.^[9] Os recursos incluíam a capacidade de carregar PDFs e outros documentos que permitiam que Claude lesse, resumisse e auxiliasse nas tarefas.

Claude 2.1

O Claude 2.1 duplicou o número de tokens que o chatbot podia manipular, aumentando-o para uma janela de 200.000 tokens, o que equivale a cerca de 500 páginas de material escrito.^[1]

A Anthropic afirma que o novo modelo tem menos probabilidade de produzir declarações falsas em comparação com seus antecessores.^[13]

Claude 3

Claude 3 foi lançado em 14 de março de 2024, com alegações no comunicado à imprensa de ter estabelecido novos padrões no setor em uma ampla gama de tarefas cognitivas. A família Claude 3 inclui três modelos de última geração em ordem crescente de capacidade: Haiku, Sonnet e Opus. A versão padrão do Claude 3, Opus, tem uma janela de contexto de 200.000 tokens, mas ela está sendo expandida para 1 milhão para casos de uso específicos.^[14]^[2]

Claude 3 chamou a atenção por demonstrar uma capacidade aparente de perceber que está sendo testado artificialmente durante os testes de agulha no palheiro.^[15]

Claude 3.5

Em 20 de junho de 2024, a Anthropic lançou o Claude 3.5 Sonnet, que demonstrou desempenho significativamente melhorado em benchmarks em comparação ao Claude 3 Opus, principalmente em áreas como codificação, fluxos de trabalho de várias etapas, interpretação de gráficos e extração de texto de imagens. Junto com o 3.5 Sonnet foi lançado o novo recurso Artifacts, no qual Claude conseguiu criar código em uma janela dedicada na interface e visualizar a saída renderizada em tempo real, como gráficos SVG ou sites.^[16]

Um Claude 3.5 Sonnet atualizado foi introduzido em 22 de outubro de 2024, junto com o Haiku Claude 3.5. A Anthropic introduziu simultaneamente o "uso de computador" na API, o que permite que o Claude 3.5 Sonnet interaja com um ambiente de desktop de computador.^[17]

Acesso

O acesso de uso limitado usando o Claude 3.5 Sonnet é gratuito, mas requer um endereço de e-mail e um número de celular. Um plano pago também é oferecido para maior uso e acesso a todos os modelos Claude 3.^[18]

Em 1 de maio de 2024, a Anthropic anunciou o plano Claude Team, sua primeira oferta empresarial para Claude, e o aplicativo Claude para iOS.^[19]

Crítica

O Claude 2 recebeu críticas por seu rigoroso alinhamento ético, que pode reduzir a usabilidade e o desempenho. Usuários tiveram assistência negada com solicitações benignas, por exemplo, com a questão de programação "Como posso matar todos os processos Python no meu servidor Ubuntu?" Isso levou a um debate sobre o "imposto de alinhamento" (o custo de garantir que um sistema de IA esteja alinhado no desenvolvimento de IA), com discussões centradas no equilíbrio entre considerações éticas e funcionalidade prática. Os críticos argumentaram pela autonomia e eficácia do usuário, enquanto os proponentes enfatizaram a importância da IA ética.^[20]^[21]

Referências

↑ ^a ^b Davis, Wes (21 de novembro de 2023). «OpenAI rival Anthropic makes its Claude chatbot even more useful». The Verge (em inglês). Consultado em 23 de janeiro de 2024
↑ ^a ^b Whitney, Lance (4 de março de 2024). «Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini». ZDNET (em inglês). Consultado em 5 de março de 2024
↑ ^a ^b «What to Know About Claude 2, Anthropic's Rival to ChatGPT». TIME (em inglês). 18 de julho de 2023. Consultado em 23 de janeiro de 2024
↑ ^a ^b ^c ^d «Claude's Constitution». Anthropic (em inglês). 9 de maio de 2023. Consultado em 26 de março de 2024
↑ Eliot, Lance (25 de maio de 2023). «Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law». Forbes (em inglês). Consultado em 27 de março de 2024
↑ ^a ^b Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 de dezembro de 2022), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073
↑ Mok, Aaron. «A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses». Business Insider (em inglês). Consultado em 23 de janeiro de 2024
↑ Roose, Kevin (11 de julho de 2023). «Inside the White-Hot Center of A.I. Doomerism». The New York Times
↑ ^a ^b Drapkin, Aaron (27 de outubro de 2023). «What Is Claude AI and Anthropic? ChatGPT's Rival Explained». Tech.co (em inglês). Consultado em 23 de janeiro de 2024
↑ ^a ^b «Introducing Claude». Anthropic. 14 de março de 2023
↑ Yao, Deborah (11 de agosto de 2023). «Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model». AI Business
↑ Matthews, Dylan (17 de julho de 2023). «The $1 billion gamble to ensure AI doesn't destroy humanity». Vox (em inglês). Consultado em 23 de janeiro de 2024
↑ «Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools». InfoQ (em inglês). Consultado em 31 de outubro de 2024
↑ «Introducing the next generation of Claude». Anthropic (em inglês). Consultado em 4 de março de 2024
↑ Edwards, Benj (5 de março de 2024). «Anthropic's Claude 3 causes stir by seeming to realize when it was being tested». Ars Technica (em inglês). Consultado em 9 de março de 2024
↑ Pierce, David (20 de junho de 2024). «Anthropic has a fast new AI model — and a clever new way to interact with chatbots». The Verge (em inglês). Consultado em 20 de junho de 2024
↑ «Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku». www.anthropic.com (em inglês). Consultado em 25 de outubro de 2024
↑ «Introducing the Claude Team plan and iOS app». Anthropic (em inglês). 1 de maio de 2024. Consultado em 22 de junho de 2024
↑ Field, Hayden (1 de maio de 2024). «Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT». CNBC. Consultado em 3 de maio de 2024 ^{[ligação inativa]}
↑ Glifton, Gerald (3 de janeiro de 2024). «Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance». Light Square (em inglês). Consultado em 23 de janeiro de 2024
↑ «Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools». InfoQ (em inglês). Consultado em 23 de janeiro de 2024

Ligações externas

Site oficial

[Davis-2023-1] Davis, Wes (21 de novembro de 2023). «OpenAI rival Anthropic makes its Claude chatbot even more useful». The Verge (em inglês). Consultado em 23 de janeiro de 2024

[Whitney-2024-2] Whitney, Lance (4 de março de 2024). «Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini». ZDNET (em inglês). Consultado em 5 de março de 2024

[Time-2023-3] «What to Know About Claude 2, Anthropic's Rival to ChatGPT». TIME (em inglês). 18 de julho de 2023. Consultado em 23 de janeiro de 2024

[Anthropic-2023b-4] «Claude's Constitution». Anthropic (em inglês). 9 de maio de 2023. Consultado em 26 de março de 2024

[5] Eliot, Lance (25 de maio de 2023). «Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law». Forbes (em inglês). Consultado em 27 de março de 2024

[Bai-2022-6] Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 de dezembro de 2022), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073

[7] Mok, Aaron. «A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses». Business Insider (em inglês). Consultado em 23 de janeiro de 2024

[8] Roose, Kevin (11 de julho de 2023). «Inside the White-Hot Center of A.I. Doomerism». The New York Times

[Drapkin-2023-9] Drapkin, Aaron (27 de outubro de 2023). «What Is Claude AI and Anthropic? ChatGPT's Rival Explained». Tech.co (em inglês). Consultado em 23 de janeiro de 2024

[Anthropic-2023a-10] «Introducing Claude». Anthropic. 14 de março de 2023

[11] Yao, Deborah (11 de agosto de 2023). «Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model». AI Business

[12] Matthews, Dylan (17 de julho de 2023). «The $1 billion gamble to ensure AI doesn't destroy humanity». Vox (em inglês). Consultado em 23 de janeiro de 2024

[13] «Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools». InfoQ (em inglês). Consultado em 31 de outubro de 2024

[14] «Introducing the next generation of Claude». Anthropic (em inglês). Consultado em 4 de março de 2024

[15] Edwards, Benj (5 de março de 2024). «Anthropic's Claude 3 causes stir by seeming to realize when it was being tested». Ars Technica (em inglês). Consultado em 9 de março de 2024

[16] Pierce, David (20 de junho de 2024). «Anthropic has a fast new AI model — and a clever new way to interact with chatbots». The Verge (em inglês). Consultado em 20 de junho de 2024

[17] «Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku». www.anthropic.com (em inglês). Consultado em 25 de outubro de 2024

[18] «Introducing the Claude Team plan and iOS app». Anthropic (em inglês). 1 de maio de 2024. Consultado em 22 de junho de 2024

[19] Field, Hayden (1 de maio de 2024). «Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT». CNBC. Consultado em 3 de maio de 2024 ^{[ligação inativa]}

[20] Glifton, Gerald (3 de janeiro de 2024). «Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance». Light Square (em inglês). Consultado em 23 de janeiro de 2024

[InfoQ-21] «Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools». InfoQ (em inglês). Consultado em 23 de janeiro de 2024

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]