Biblioteca · Paper · 2020 · NeurIPS

Language Models are Few-Shot Learners (GPT-3)

Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., et al.

Provou que escala bruta produz emergência de capacidades novas. Tornou viável usar IA via 'prompt' em vez de treinamento, modelo de negócio que viabilizou OpenAI e toda indústria de APIs de LLM.

A leitura do Thiago

GPT-3 foi o paper que provou comercialmente que TAMANHO importa em IA, e mudou o modelo mental do setor. Antes, para cada tarefa nova você precisava treinar um modelo do zero com dados rotulados (caro, lento, especializado). GPT-3 mostrou que, se o modelo for grande o suficiente (175 bilhões de parâmetros, na época absurdo), basta DESCREVER a tarefa em texto e dar 2-3 exemplos para a máquina executá-la, sem nenhum re-treinamento.

Esse fenômeno, chamado 'in-context learning', virou a indústria de cabeça para baixo. Para o C-level brasileiro, três lições práticas: (1) o paradigma 'IA como API' que sustenta OpenAI, Anthropic e a maioria das startups de IA nasceu aqui; (2) capacidades 'emergentes', habilidades que só aparecem após certo tamanho, significam que escolher o modelo certo importa mais do que o prompt perfeito; (3) o que antes exigia uma equipe de cientistas de dados por seis meses, hoje um analista bem treinado faz em uma tarde, simplesmente escrevendo bons prompts. É a base econômica do hype atual.

O que muda na prática

A virada concreta que o GPT-3 trouxe para a sua operação é esta: você pode resolver uma boa parte das tarefas de IA descrevendo o que quer em texto e dando dois ou três exemplos, sem contratar projeto de treinamento, sem cientista de dados, sem ciclo de meses. Antes, automatizar uma tarefa nova exigia coletar dados rotulados e treinar um modelo, um investimento que só se justificava em volume alto. Agora um analista bem treinado monta um protótipo funcional numa tarde escrevendo um bom prompt.

Isso desloca onde está o gargalo: deixou de ser tecnologia e dinheiro, passou a ser clareza sobre o que você quer e capacidade de descrever bem o problema. Para o operador, isso muda o método de implantação. O caminho mais rápido e barato para testar uma ideia de IA hoje é começar pelo prompt com exemplos, medir se funciona, e só investir em algo mais pesado (ajuste fino do modelo, treinamento próprio) quando o caso de uso provar valor e o volume justificar.

Inverter essa ordem, começar pelo projeto grande, é o erro clássico que queima orçamento. A regra prática vira: protótipo por prompt primeiro, engenharia depois, e só se os números pedirem. Há uma armadilha de governança embutida que o líder precisa enxergar.

Como agora qualquer pessoa com acesso a uma ferramenta de IA consegue automatizar tarefas escrevendo texto, surge IA informal pela empresa toda, gente colando dados de cliente, contratos e planilhas em ferramentas públicas para ganhar tempo. Isso é simultaneamente o maior ganho de produtividade e o maior risco de vazamento da década. A decisão de liderança não é proibir (não funciona), é dar uma alternativa segura e sancionada, mais uma política clara do que pode e não pode ser colado onde.

Quem não oferece o caminho oficial empurra a equipe para o caminho perigoso.

O abstract original (inglês)

We train GPT-3, an autoregressive language model with 175 billion parameters, 10x more than any previous non-sparse language model, and test its performance in the few-shot setting. For all tasks, GPT-3 is applied without any gradient updates or fine-tuning, with tasks and few-shot demonstrations specified purely via text interaction.

llmscalingfew-shotfoundational

Ler o paper original →

O que você achou desta página?

Recomendaria esta página para alguém do seu time?