PUBLICIDADE

Esse homem não existe: testamos o Veo 3, nova IA de vídeos realistas do Google, e os resultados impressionam


Um único final de semana foi suficiente para as redes sociais ficarem cheias de vídeos gerados pela nova inteligência artificial do Google, o Veo 3. A ferramenta das Gigantes das Buscas cria clipes ricos em detalhes a partir de descrições em texto — mas com um diferencial: a capacidade de adicionar áudio, incluindo falas.

O Veo 3 é um modelo generativo de alta qualidade, assim como concorrentes da mesma categoria, como o Sora da OpenAI. Ele interpreta a descrição do usuário, que pode definir detalhes sobre a cena (cenário, personagens, objetos, tipo de câmera, contexto e mais), e gera um vídeo curto com base nessa descrição.

Contudo, a tecnologia rapidamente chamou a atenção do público pelas suas criações extremamente realistas. Além de seguir fielmente o roteiro fornecido no prompt, os vídeos gerados pela IA são bastante convincentes — e levemente assustadores. O TecMundo destaca alguns deles a seguir:

Testamos o Veo 3

Assim que os vídeos sintéticos do Veo 3 começaram a circular nas redes sociais, o TecMundo passou a testar as capacidades do modelo. A interface oferece uma simples caixa de texto em que você deve inserir o que espera do vídeo.

Depois de enviada a descrição através do Gemini, a ferramenta processa a solicitação por alguns minutos. Essa etapa pode demorar ou até ser cancelada totalmente, caso a demanda pública por criações esteja muito alta no momento.

Quanto à qualidade das reações, o resultado varia. Um dos vídeos gerados apresentou baixa resolução, elementos pouco consistentes e não entregou exatamente o que era esperado.

Por outro lado, alguns projetos são bastante realistas. Um dos exemplos está abaixo, em que foi solicitado o clipe de uma reportagem sobre catástrofes climáticas no Brasil usando o prompt: “Create a video about a climate change catastrophe in Brazil, told from the perspective of a news reporter.” (“Crie um vídeo sobre uma catástrofe de mudança climática no Brasil, contada da perspectiva de um repórter”, em tradução livre). O resultado você confere abaixo:

As falas e o movimento dos lábios do apresentador, bem como a montagem da cena, são ligeiramente estranhos — caindo quase no “vale da estranheza”, se observados com atenção.

Depois de gerado, o vídeo pode ser baixado em diferentes formatos. No Gemini, o download pode ser feito em MP4; no Flow, por sua vez, pode ser em MP4 ou GIF.

Para essa reportagem, o TecMundo tentou criar um vídeo de uma cobertura de evento de tecnologia. O Veo 3 não entregou o resultado devido a alta demanda de solicitações.

Foi possível continuar os testes no Flow, plataforma dedicada à geração de vídeos. Por lá, a IA entrega até dois resultados por cada prompt oferecido.

O vídeo abaixo foi gerado a partir do prompt “Create a Valorant Video” (“Crie um vídeo de Valorant”, em tradução livre). A intenção do teste era conferir se o Veo 3 é capaz de seguir as características do produto solicitado — Valorant, o FPS da Riot Games. Contudo, ele não só não seguiu a descrição, como também montou uma interface bem parecida com Cyberpunk 2077, da CD Projekt Red.

Veo 3 tem limitações

O Veo 3 é um poderoso modelo generativo do Google, mas apresenta limitações importantes para o público. A primeira delas é a restrição de idioma: no Gemini, as descrições podem ser em português; o Flow, no entanto, só entende inglês.

Apesar disso, o Veo 3 também gera vídeos com falas em português. Portanto, embora o roteiro precise ser escrito em inglês, os personagens em cena podem falar em outros idiomas. A entonação e a fluidez das falas podem não ser tão boas quanto nas criações em inglês, mas são suficientes para gerar vídeos bastante curiosos — especialmente em “reportagens sintéticas”.

Veo 3 é pago — e custa caro

Para gerar um vídeo, você precisa gastar créditos. Esses créditos só estão disponíveis para assinantes do Google AI Pro (1 mil créditos por mês) e Google AI Ultra (12,5 mil créditos por mês). Os custos de geração variam conforme a plataforma, a qualidade e o modelo escolhidos:

  • Whisk: 10 créditos por vídeo;
  • Flow (Fast): 10 créditos por vídeo;
  • Flow (Quality – Veo 2): 100 créditos por vídeo;
  • Flow (Highest Quality – Veo 3): 150 créditos.

No plano mais acessível, o preço mensal é de R$ 96,99. Estudantes, no entanto, podem aproveitar 15 meses gratuitos da assinatura. No plano mais caro, o Gemini AI Ultra de R$ 1.209,90 por mês.

Quer saber mais sobre o avanço das IAs generativas e como elas estão moldando o futuro da tecnologia? Siga o TecMundo nas redes sociais e acompanhe nossas atualizações diárias com análises, testes e curiosidades do mundo tech.



Fonte: TecMundo

Leia mais

PUBLICIDADE