Biblioteca · Paper · 2023 · arXiv (Meta)

LLaMA: Open and Efficient Foundation Language Models

Touvron, H., Lavril, T., Izacard, G., Martinet, X., Lachaux, M.-A., et al.

Primeiro LLM realmente competitivo a circular publicamente. Vazou e desencadeou explosão de inovação em modelos open-source (Alpaca, Vicuna, etc.), tirando o controle exclusivo da OpenAI/Google.

A leitura do Thiago

LLaMA da Meta foi o paper que quebrou o monopólio dos LLMs proprietários. Em fevereiro de 2023, a Meta liberou (inicialmente para pesquisadores, mas vazou rapidamente) um modelo que rivalizava com GPT-3 sendo 13x menor, e qualquer pessoa com uma GPU decente podia rodar. Em duas semanas após o vazamento, surgiram Alpaca, Vicuna, Koala e dezenas de variantes ajustadas para tarefas específicas a custo de centenas de dólares.

Em linguagem executiva: foi o início da 'commoditização' dos LLMs, evento equivalente ao Linux quebrando o monopólio do Windows nos anos 90. Para corporações brasileiras, três implicações estratégicas que mudaram tudo: (1) deixou de ser obrigatório depender de OpenAI/Anthropic, agora há a opção real de rodar LLMs ON-PREMISES, crucial para setores regulados (bancos, saúde, governo) onde dados não podem sair da empresa; (2) o custo marginal de inferência de IA caiu para próximo de zero em muitos casos de uso, viabiliza assistentes internos massivos sem custo por token; (3) gerou ecossistema brasileiro de LLMs em português (Sabiá, Maritaca, Bode), entender LLaMA é entender a infraestrutura sobre a qual eles são construídos. Lição maior: em IA, abrir o jogo costuma vencer fechar o jogo.

O que muda na prática

A consequência prática do LLaMA para quem decide é simples e cara de ignorar: você ganhou poder de barganha. Antes dele, montar um assistente de IA significava assinar com OpenAI ou Google e aceitar que cada interação trafega pelo servidor deles. Depois dele, existe a opção real de rodar um modelo competente dentro da sua infraestrutura, com seus dados nunca saindo de casa.

Para um banco, uma operadora de saúde, um escritório de advocacia ou qualquer empresa em setor regulado, isso deixou de ser detalhe técnico e virou critério de viabilidade: dá para usar IA generativa em cima de dados sensíveis sem violar contrato de sigilo ou exposição regulatória. A decisão concreta que isso destrava é a do build versus buy com um terceiro caminho. Não é mais só 'comprar API pronta' ou 'treinar do zero' (caríssimo).

É 'pegar um modelo aberto, ajustar com meus dados e rodar onde eu controlo'. Ao avaliar um fornecedor de IA, pergunte qual é a base do produto: se é um wrapper sobre API da OpenAI, você está pagando margem sobre uma dependência que não controla e que pode mudar preço ou política amanhã. Se é construído sobre modelo aberto que pode ser internalizado, sua posição de longo prazo é muito mais forte.

Para o mercado brasileiro especificamente, este paper é a fundação dos modelos em português que surgiram depois (Sabiá, Maritaca). Quem opera no Brasil deveria entender isso porque resolve um problema concreto: modelos americanos genéricos custam mais tokens e erram mais em português jurídico, fiscal e regional. A lição estratégica maior é desconfiar de quem trata open-source como brinquedo de pesquisador.

Em IA, abrir o jogo tem vencido fechar o jogo repetidamente, e ignorar essa opção por preconceito custa dinheiro real em licenças e em soberania sobre os próprios dados.

O abstract original (inglês)

We introduce LLaMA, a collection of foundation language models ranging from 7B to 65B parameters. We show that it is possible to train state-of-the-art models using publicly available datasets exclusively. In particular, LLaMA-13B outperforms GPT-3 (175B) on most benchmarks.

llmopen-sourcemetafoundational

Ler o paper original →

O que você achou desta página?

Recomendaria esta página para alguém do seu time?