terça-feira, 19 de maio de 2026

IA e Diversão: Ferramentas chinesas de vídeo por IA ultrapassam OpenAI e Google

 


Modelos da ByteDance e Kuaishou superam rivais ocidentais em realismo e escala

Plataformas como TikTok fornecem vastas bibliotecas de vídeos curtos para treinamento de modelos.

Grupos chineses de inteligência artificial avançaram à frente dos rivais dos Estados Unidos na geração de vídeo, um campo de batalha fundamental na IA generativa que apresenta rápida adoção nos setores de publicidade, e-commerce e entretenimento.

Empresas como a ByteDance e a Kuaishou, sediadas em Pequim, estão treinando sistemas em vastas bibliotecas de vídeos curtos, o que lhes confere uma vantagem sobre os competidores americanos.

A mudança marca uma divergência na corrida da IA: enquanto OpenAI, Google e Anthropic ainda dominam os grandes modelos de linguagem (LLMs) e áreas como programação, suas ferramentas de vídeo estão atrás das ofertas chinesas em qualidade e usabilidade, de acordo com desenvolvedores e múltiplos rankings de uso.

O treinamento de modelos de vídeo exige grandes quantidades de imagens de alta qualidade, uma área em que as plataformas chinesas levam vantagem devido à propriedade de aplicativos de vídeos curtos, como o TikTok, e aos dados que eles geram. Alguns especialistas argumentam que os grupos chineses também têm sido mais agressivos no acesso a materiais protegidos por direitos autorais.

"A maioria dos modelos americanos que testamos não é muito boa na geração de vídeo", afirmou Ben Chiang, fundador da Director AI, uma startup que produz conteúdo gerado por IA, como desenhos animados e dramas curtos. Ele disse que controles de conteúdo mais rígidos limitam as ferramentas dos EUA e frequentemente produzem resultados menos realistas.

A Director AI utiliza principalmente o Kling, desenvolvido pela Kuaishou, alternando também entre o Seedance 2.0, da ByteDance, e o Hailuo, da startup MiniMax, dependendo da tarefa e do custo.

"Tudo se resume à qualidade e ao quão bem o modelo segue o comando (prompt)", disse Chiang, acrescentando que avanços recentes tornaram as ferramentas mais fluidas, especialmente na sincronização de áudio e na estabilização de vozes.

Para os criadores, as melhorias já estão remodelando a produção. "O Seedance 2.0 foi um divisor de águas para minha liberdade criativa", disse George Won, cineasta independente de IA e editor em Tbilisi, na Geórgia. "Ele lida com ângulos de câmera agressivos e velocidade sem perder o rosto do personagem ou o contraste de iluminação."

O Kling, o Seedance 2.0 e o HappyHorse 1.0 obtiveram pontuações altas no ranking Arena dos melhores modelos de vídeo, compilado a partir de votos de usuários na plataforma independente. Tais avaliações são vistas como mais confiáveis do que a maioria dos sistemas de comparação, para os quais os laboratórios de IA se otimizam e que não refletem necessariamente o desempenho no mundo real.

O modelo Veo 3, do Google, também é competitivo —especialistas dizem que ele tem vantagem pelo acesso às imagens do YouTube—, mas possui mais salvaguardas e limitações de conteúdo para desenvolvedores.

O progresso é sustentado pelo acesso a volumes massivos de dados de vídeo proprietários. ByteDance e Kuaishou operam algumas das maiores plataformas de vídeos curtos do mundo, o que lhes dá uma vantagem de treinamento difícil de ser replicada — especialmente porque o conteúdo de vídeo, ao contrário do texto, não pode ser facilmente coletado em escala.

Esta semana, a Kuaishou anunciou que está explorando opções para separar a unidade de negócios do Kling e, potencialmente, buscar uma listagem independente na bolsa para capitalizar seu crescente negócio de vídeo com IA.

O uso desse material também atraiu escrutínio. A ByteDance enfrentou ameaças legais por supostas violações de direitos autorais ao permitir que usuários criassem vídeos com personagens, inclusive de filmes da Marvel e da série South Park, sem a devida permissão. O grupo chinês de internet prometeu aumentar as proteções.

Vários desenvolvedores e criadores disseram que restrições de conteúdo mais frouxas tornam os modelos chineses mais fáceis de usar na prática. Chiang afirmou que as ferramentas dos EUA "frequentemente encontram erros", negando solicitações por violação de termos de uso sem maiores explicações.

Para criadores individuais, as plataformas chinesas costumam ser mais baratas e flexíveis do que as alternativas ocidentais, oferecendo sistemas de assinatura ou pagamento por uso que permitem experimentação rápida. No entanto, a alta demanda pelo Seedance 2.0 desde fevereiro levou a restrições de uso e longos tempos de espera para alguns usuários.

Para clientes corporativos, a ByteDance adotou uma abordagem diferente. Para alguns clientes baseados nos EUA, ela exigiu grandes compromissos iniciais, pedindo que pagassem cerca de US$ 2 milhões para acesso e alocação de créditos, de acordo com pessoas familiarizadas com o assunto. A ByteDance não respondeu a um pedido de comentário.

A geração de vídeo requer muito mais tokens —as unidades de dados processadas por modelos de IA— do que texto ou áudio, tornando a implantação em larga escala cara. Em março, a OpenAI descontinuou seu modelo de geração de vídeo Sora, em parte devido aos altos custos computacionais.

Para as empresas que constroem sobre essa tecnologia, o salto recente na qualidade está abrindo oportunidades comerciais.

"Antes, os vídeos eram estranhos e robóticos —não atendiam aos padrões das marcas", disse Vincent Yang, CEO da Firework, que fornece infraestrutura de vídeo para sites de e-commerce. "Agora estamos no ponto em que não se consegue distinguir se é IA ou humano."

Yang disse que a tecnologia já está remodelando a publicidade ao permitir que marcas gerem vídeos em uma escala antes impossível. "Um varejista nos pediu para criar 100.000 vídeos para suas páginas de produtos", contou ele. "Sem IA, isso seria proibitivamente caro. Agora, cada produto pode ter seu próprio vídeo, e até múltiplas versões adaptadas para diferentes clientes."

Fonte: Financial Times e Folha de SP (17/05/2026)

Nenhum comentário:

Postar um comentário

"Este blog não se responsabiliza pelos comentários emitidos pelos leitores, mesmo anônimos, e DESTACAMOS que os IPs de origem dos possíveis comentários OFENSIVOS ficam disponíveis nos servidores do Google/ Blogger para eventuais demandas judiciais ou policiais".