Biblioteca · Repositório

KwaiVGI/LivePortrait

Imagem, vídeo e avatares · Python · Open source (verificar termos no repositório)

É uma ferramenta que pega uma foto de rosto parado e a anima com a expressão e o movimento de um vídeo de referência. Em vez de criar do nada, ele transfere movimento real para um retrato existente.

O que é, em uma frase honesta

LivePortrait é um sistema de animação de retrato: você dá uma foto de rosto parada e um vídeo de alguém se mexendo e falando, e ele faz o rosto da foto reproduzir aquela expressão e aquele movimento. A lógica é transferência de movimento, não geração do zero, o que tende a dar resultados mais controláveis e rápidos. Funciona com rostos humanos e também com animais, como gatos e cães, e oferece controle fino sobre regiões do rosto e ajuste de expressão.

Vem da KwaiVGI, ligada ao grupo do Kuaishou.

Para que serve na prática

Serve para transformar uma imagem estática em um avatar que se mexe, sem filmar a pessoa de novo. Casos comuns incluem criar vídeos de cabeça falante a partir de uma foto, dar vida a um personagem ou mascote, e editar movimento em vídeos já existentes. Por ser eficiente, é usado dentro de plataformas e apps de vídeo de grande escala, integrado a produtos de edição e streaming.

Para um time de conteúdo, é o caminho mais direto entre uma foto de marca e um vídeo animado dela.

Quando faz sentido pra você que lidera

Faz sentido quando você quer produzir avatares animados de forma barata e em escala, por exemplo para conteúdo educacional, atendimento ou personalização. A decisão de líder mais importante aqui não é técnica, é ética e de risco: animar rostos a partir de fotos é a mesma base que sustenta deepfakes, então qualquer uso precisa de regra clara sobre consentimento de quem aparece e transparência com quem assiste. Bem governada, é uma ferramenta de produção poderosa; mal governada, é passivo de reputação.

Defina a política antes de liberar o uso.

Por que está no mapa

LivePortrait é uma das ferramentas de animação de retrato mais usadas e integradas em produtos reais de vídeo, o que prova maturidade além do laboratório. Está no mapa porque representa uma categoria que toca diretamente confiança e autenticidade: a capacidade de fazer um rosto dizer e expressar o que você quiser. Para quem lidera, é o exemplo concreto de uma tecnologia útil e arriscada ao mesmo tempo, onde a governança não é detalhe, é a condição de uso.

Ver no GitHub →
O que você achou desta página?
Recomendaria esta página para alguém do seu time?