Um único final de semana foi suficiente para as redes sociais ficarem cheias de vídeos gerados pela nova inteligência artificial do Google, o Veo 3. A ferramenta das Gigantes das Buscas cria clipes ricos em detalhes a partir de descrições em texto — mas com um diferencial: a capacidade de adicionar áudio, incluindo falas.
O Veo 3 é um modelo generativo de alta qualidade, assim como concorrentes da mesma categoria, como o Sora da OpenAI. Ele interpreta a descrição do usuário, que pode definir detalhes sobre a cena (cenário, personagens, objetos, tipo de câmera, contexto e mais), e gera um vídeo curto com base nessa descrição.
Contudo, a tecnologia rapidamente chamou a atenção do público pelas suas criações extremamente realistas. Além de seguir fielmente o roteiro fornecido no prompt, os vídeos gerados pela IA são bastante convincentes — e levemente assustadores. O TecMundo destaca alguns deles a seguir:
Testamos o Veo 3
Assim que os vídeos sintéticos do Veo 3 começaram a circular nas redes sociais, o TecMundo passou a testar as capacidades do modelo. A interface oferece uma simples caixa de texto em que você deve inserir o que espera do vídeo.
Depois de enviada a descrição através do Gemini, a ferramenta processa a solicitação por alguns minutos. Essa etapa pode demorar ou até ser cancelada totalmente, caso a demanda pública por criações esteja muito alta no momento.
Quanto à qualidade das reações, o resultado varia. Um dos vídeos gerados apresentou baixa resolução, elementos pouco consistentes e não entregou exatamente o que era esperado.
Por outro lado, alguns projetos são bastante realistas. Um dos exemplos está abaixo, em que foi solicitado o clipe de uma reportagem sobre catástrofes climáticas no Brasil usando o prompt: “Create a video about a climate change catastrophe in Brazil, told from the perspective of a news reporter.” (“Crie um vídeo sobre uma catástrofe de mudança climática no Brasil, contada da perspectiva de um repórter”, em tradução livre). O resultado você confere abaixo:
As falas e o movimento dos lábios do apresentador, bem como a montagem da cena, são ligeiramente estranhos — caindo quase no “vale da estranheza”, se observados com atenção.
Depois de gerado, o vídeo pode ser baixado em diferentes formatos. No Gemini, o download pode ser feito em MP4; no Flow, por sua vez, pode ser em MP4 ou GIF.
Para essa reportagem, o TecMundo tentou criar um vídeo de uma cobertura de evento de tecnologia. O Veo 3 não entregou o resultado devido a alta demanda de solicitações.
Foi possível continuar os testes no Flow, plataforma dedicada à geração de vídeos. Por lá, a IA entrega até dois resultados por cada prompt oferecido.
O vídeo abaixo foi gerado a partir do prompt “Create a Valorant Video” (“Crie um vídeo de Valorant”, em tradução livre). A intenção do teste era conferir se o Veo 3 é capaz de seguir as características do produto solicitado — Valorant, o FPS da Riot Games. Contudo, ele não só não seguiu a descrição, como também montou uma interface bem parecida com Cyberpunk 2077, da CD Projekt Red.
Veo 3 tem limitações
O Veo 3 é um poderoso modelo generativo do Google, mas apresenta limitações importantes para o público. A primeira delas é a restrição de idioma: no Gemini, as descrições podem ser em português; o Flow, no entanto, só entende inglês.
Apesar disso, o Veo 3 também gera vídeos com falas em português. Portanto, embora o roteiro precise ser escrito em inglês, os personagens em cena podem falar em outros idiomas. A entonação e a fluidez das falas podem não ser tão boas quanto nas criações em inglês, mas são suficientes para gerar vídeos bastante curiosos — especialmente em “reportagens sintéticas”.
Veo 3 é pago — e custa caro
Para gerar um vídeo, você precisa gastar créditos. Esses créditos só estão disponíveis para assinantes do Google AI Pro (1 mil créditos por mês) e Google AI Ultra (12,5 mil créditos por mês). Os custos de geração variam conforme a plataforma, a qualidade e o modelo escolhidos:
- Whisk: 10 créditos por vídeo;
- Flow (Fast): 10 créditos por vídeo;
- Flow (Quality – Veo 2): 100 créditos por vídeo;
- Flow (Highest Quality – Veo 3): 150 créditos.
No plano mais acessível, o preço mensal é de R$ 96,99. Estudantes, no entanto, podem aproveitar 15 meses gratuitos da assinatura. No plano mais caro, o Gemini AI Ultra de R$ 1.209,90 por mês.
Quer saber mais sobre o avanço das IAs generativas e como elas estão moldando o futuro da tecnologia? Siga o TecMundo nas redes sociais e acompanhe nossas atualizações diárias com análises, testes e curiosidades do mundo tech.
Fonte: TecMundo