"Absolutamente incrível": chega Sora, a nova IA que gera vídeos com instruções simples

As imagens são hiperrealistas e nítidas, de maneira que a cada vez será mais difícil distinguir os 'clips' de eventos reais dos falsos em internet

16.02.2024 17:24h

Juan Manuel Del Olmo

Uma pessoa utiliza várias ferramentas de IA especializadas em design gráfico / FREEPIK

A inteligência artificial avança a passos agigantados, e a cada vez é mais difícil distinguir em internet que foto, texto ou audio é real (genuino, criado por humanos) e qual tem sido gerado com este tipo de ferramentas. A última novidade é Sora, um modelo de IA capaz de criar vídeos realistas e imaginativos a partir de instruções de texto singelas e específicas.

"Estamos a ensinar à IA a compreender e simular o mundo físico em movimento, com o objectivo de treinar modelos que ajudem às pessoas a resolver problemas que requeiram interacção com o mundo real. Apresentamos Sora, nosso modelo de texto a vídeo", indica OpenAI, o desenvolvedor que também está por trás de ChatGPT .

Vídeos de até um minuto de duração

Sora pode gerar vídeos de até um minuto de duração mantendo a qualidade visual e cumprindo com fidelidade as indicações do utente. A qualidade dos mesmos resulta surpreendente, tanto que convida a pensar que, a partir de agora, será difícil distinguir a gravação de um acontecimento veraz de uma ficção gerada com IA. Assim mesmo, abrem-se novos horizontes no âmbito dos vídeos publicitários ou os videoclips. Por outra parte, é de esperar que, com Sora, os deep fakes atinjam cotas de realismo espantosas.

O modelo tem um profundo conhecimento da linguagem, o que lhe permite interpretar indicações com precisão e gerar "personagens convincentes que expressam emoções vibrantes", diz OpenAI. Ademais, Sora pode criar múltiplas tomadas dentro de um sozinho vídeo. Em definitiva, uma revolução cujos efeitos são difíceis de calibrar.

Reacções em redes sociais

Em redes sociais, muitos utentes mostraram-se estupefactos ante as capacidades desta IA. "Um pouco de medo sim que dá", dizia um internauta na rede social X (antiga Twitter). "Brutal. Absolutamente incrível. Acabam de apresentar #SORA, o gerador de videos por texto de #OpenAI. É aproximadamente 20 vezes melhor que Pika, Runway e outros líderes actuais. O nível de qualidade rompe qualquer expectativa no mercado", dizia outra.

Também há quem se mostraram alarmados. "Hoje o mundo digital tem mudado de maneira estrutural com Sora. É brutal o que se pode fazer com essa IA generativa. A partir de hoje, mundo, todo o vídeo em internet é falso até que se prove o contrário", vaticinaba um terceiro.

Erros e imprecisiones

Com tudo, a ferramenta ainda tem muita capacidade de melhora. "O modelo pode confundir os detalhes espaciais de uma mensagem, por exemplo, misturando esquerda e direita, e pode ter dificuldades com descrições precisas de eventos que têm lugar ao longo do tempo, como seguir uma trajectória de câmara específica", reconhece o desenvolvedor.

Por enquanto, os criadores têm outorgado acesso a sua ferramenta a vários artistas visuais, desenhadores e cineastas "para obter comentários sobre como fazer avançar o modelo para que seja mais útil para os profissionais criativos".