genmoai/mochi
É um gerador de vídeo aberto da Genmo, com licença genuinamente permissiva, que se destacou por encurtar a distância entre o que era possível de graça e o que os serviços pagos entregavam. Foca em movimento de alta qualidade e aderência ao texto, em resolução menor.
O que é, em uma frase honesta
Mochi 1 é um modelo de geração de vídeo de 10 bilhões de parâmetros lançado aberto pela Genmo, apresentado como o maior modelo de vídeo realmente livre na época do lançamento. Ele transforma texto em vídeos de 480p com movimento fluido e boa fidelidade ao que foi descrito. Vem com interface gráfica e linha de comando, e permite ajuste fino com técnicas leves em placas de consumidor.
O ponto forte é a licença Apache 2.0, sem as travas comerciais de outros modelos, mas pede cerca de 60 GB de memória para rodar em uma GPU.
Para que serve na prática
Serve para gerar clipes a partir de texto com prioridade em movimento convincente, útil para conteúdo onde a dinâmica importa mais que a resolução máxima. A possibilidade de ajuste fino em custom datasets atrai quem quer um modelo que entenda um estilo ou tema específico do negócio. Em compensação, ele se sai melhor em cenas fotorrealistas e tropeça em animação e movimentos extremos, então a adequação depende do tipo de conteúdo.
A resolução de 480p limita usos que exigem alta definição.
Quando faz sentido pra você que lidera
Faz sentido quando a licença verdadeiramente aberta é prioridade, por exemplo se você quer construir um produto sobre o modelo sem amarras comerciais, e quando seus casos toleram resolução menor. A decisão de líder envolve pesar essa liberdade jurídica contra a exigência de hardware e o limite de resolução. Para times técnicos que querem treinar o modelo no estilo da própria marca, o suporte a ajuste fino é um diferencial concreto.
Avalie como base de construção, não como ferramenta de prateleira para o time de conteúdo.
Por que está no mapa
Mochi marcou o momento em que um modelo de vídeo grande e de licença genuinamente livre encurtou de forma visível a distância para os serviços fechados. Está no mapa porque licença permissiva muda quem pode construir em cima, e isso importa para empresas que querem mais do que consumir uma ferramenta, querem incorporá-la num produto. Para quem lidera, é o exemplo de que, em IA, a letra miúda da licença é tão estratégica quanto a qualidade do resultado.
Valeu pelo feedback. Isso ajuda a afiar a biblioteca.