Biblioteca · Paper · 2023 · arXiv (Meta)

Llama 2: Open Foundation and Fine-Tuned Chat Models

Touvron, H., Martin, L., Stone, K., Albert, P., et al.

Primeiro LLM open-source de qualidade comercial liberado com licença permissiva (uso comercial gratuito). Mudou o jogo regulatório e econômico, empresas finalmente podiam construir produtos sobre LLMs sem royalties.

A leitura do Thiago

Se LLaMA 1 abriu a porta, LLaMA 2 entregou as chaves. Em julho de 2023, a Meta lançou LLaMA 2 com algo que ninguém esperava: licença permitindo USO COMERCIAL gratuito por empresas com menos de 700 milhões de usuários (ou seja, praticamente todo mundo). Em paralelo, publicou o paper documentando todo o processo, incluindo o pipeline de alinhamento (RLHF) que tornou o modelo seguro o suficiente para produção.

Em linguagem executiva: a Meta entregou de graça uma tecnologia que custou centenas de milhões de dólares para desenvolver, explicitamente para minar a vantagem competitiva da OpenAI e Google. Para corporações brasileiras, este paper é provavelmente o mais imediatamente acionável da lista: (1) é a base técnica e legal de praticamente todo assistente corporativo customizado lançado em 2023-2024, incluindo soluções de bancos e varejos brasileiros que precisam manter dados em casa; (2) provou economicamente que 'open-weights' (peso do modelo aberto, mas treino fechado) é estratégia viável e até dominante, virou padrão do setor; (3) o capítulo de 'red teaming' (teste adversarial de segurança) é um manual prático para qualquer empresa que vá implementar IA generativa, vale a leitura por parte de heads de compliance, segurança e auditoria.

O que muda na prática

Se o LLaMA 1 era opção técnica, o LLaMA 2 é decisão de negócio, e a diferença está numa palavra que pouca gente lê: licença. A Meta liberou uso comercial gratuito para praticamente qualquer empresa (o limite de 700 milhões de usuários exclui só um punhado de gigantes). Na prática, isso significa que você pode construir um produto pago em cima desse modelo sem royalty, sem pedir permissão, sem risco de receber uma fatura retroativa.

Para quem decide, a ação concreta é uma: antes de assinar um contrato anual de API por usuário, calcule o custo de rodar um modelo aberto de qualidade comercial para o mesmo caso de uso. Em volume alto, a conta frequentemente vira a favor do modelo próprio. O ponto que separa este paper dos anteriores, e que vale levar para a área de compliance e segurança, é o capítulo de red teaming (teste adversarial, em que uma equipe tenta deliberadamente fazer o modelo se comportar mal).

A Meta documentou o processo de tornar o modelo seguro o suficiente para produção. Isso é, na prática, um manual de como sua empresa deveria testar qualquer IA generativa antes de colocá-la na frente de cliente: que perguntas maliciosas ela responde, que conteúdo perigoso ela gera, como você mede isso. Heads de risco e auditoria que vão aprovar uma implementação de IA deveriam exigir um relatório desse tipo do fornecedor, e este paper é o gabarito do que pedir.

No dia a dia, este é provavelmente o paper mais imediatamente acionável da lista, porque é a base técnica e legal de boa parte dos assistentes corporativos customizados que rodam em empresas brasileiras hoje. A pergunta de fornecedor muda de 'vocês usam IA?' para 'o modelo de vocês tem peso aberto e licença comercial, ou é dependência de uma API de terceiro com preço e termos que podem mudar?'. A resposta determina o quanto você controla seu próprio produto daqui a três anos.

O abstract original (inglês)

In this work, we develop and release Llama 2, a collection of pretrained and fine-tuned large language models (LLMs) ranging in scale from 7 billion to 70 billion parameters. Our fine-tuned LLMs, called Llama 2-Chat, are optimized for dialogue use cases. Our models outperform open-source chat models on most benchmarks we tested.

llmopen-sourcemetarlhf

Ler o paper original →

O que você achou desta página?

Recomendaria esta página para alguém do seu time?