O mundo da inteligência artificial segue acelerando o tempo e a criatividade. Quem imaginaria, há dez anos, que teríamos plataformas criando praticamente sozinhas textos e imagens? Pois a coisa agora ficou ainda mais sofisticada: a empresa OpenAI, responsável pelo popular ChatGPT, anunciou seu mais recente sistema. É um programa chamado Sora — “céu”, em japonês —, que transforma descrições de texto em vídeos hiperrealistas. Embora os primeiros exemplos divulgados pela empresa de São Francisco possam não resistir a uma análise minuciosa, impressionam pela meticulosidade dos detalhes.

Segundo a definição da OpenAI, empresa fundada por Sam Altman, o gerador de vídeos é capaz de criar sequências de até 60 segundos com base em instruções escritas, utilizando a inteligência artificial generativa, a forma mais avançada de IA.

O modelo revolucionário também produz vídeos a partir de imagens estáticas pré-existentes, o que aumenta o risco de deepfakes, montagens fictícias em vídio que enganam facilmente o público.

Esse ramo inovador da IA tem a capacidade de criar conteúdo original, a partir de chatbots como o próprio ChatGPT e outros geradores de imagens, como DALL-E e Midjourney.

“A criação de um programa texto-vídeo já existia. Eu mesmo já testei alguns algoritmos e ferramentas que faziam isso, mas não em um nível realista. A OpenAI vem trabalhando com alta resolução, criação de perspectivas e enquadramento a partir de texto. Os exemplos exibidos recentemente são bastante realistas. Eu acredito que será uma ótima ferramenta”, explica Murilo Gazzola, doutor e professor de Ciência da Computação da Universidade Mackenzie Alphaville.

A Inteligência Artificial chega aos vídeos
Sora: a imaginação é o limite na geração de novas imagens (Crédito:NurPhoto via AFP)

A Sora ainda não está disponível para o público em geral, pois a OpenAI ainda negocia com legisladores e artistas antes do lançamento oficial. Mas a empresa já compartilhou exemplos dos vídeos gerados que demonstram seu potencial criativo. “A área audiovisual certamente se beneficiará muito de uma tecnologia desse porte”, diz Gazzola.

Sora não é a pioneiro nesse tipo de tecnologia. Companhias como Google, Meta e a startup Runway ML já apresentaram soluções semelhantes.

Por conta de sua ampla base de dados e expertise em modelos de linguagem, como o GPT, no entanto, Sora interpreta com mais precisão instruções de vídeo, criando cenas detalhadas e impactantes, movimentos de câmera complexos e personagens realistas, tudo de forma bastante natural.

Em relação aos riscos associados à IA, as empresas de tecnologia e governos ao redor do mundo ainda pesquisam seu impacto e buscam atualizar suas regulamentações. “O relatório técnico da OpenAI não traz a transparência que gostaríamos de ver. Poderiam ser mais transparentes sobre o funcionamento de suas tecnologias e a geração de conteúdo sintético, incluindo detalhes sobre quais dados são usados para abastecê-los”, diz Gazzola.

A Inteligência Artificial chega aos vídeos
IA Generativa: tecnologia ainda não é regulamentada (Crédito:Jonathan Raa)

Ambiente inseguro

O modelo de geração de vídeo está despertando entusiasmo sobre o avanço da tecnologia de IA, juntamente com preocupações crescentes sobre como os vídeos falsos podem piorar a desinformação.

A OpenAI enfatiza a importância da segurança para o Sora, destacando a colaboração com especialistas e a implementação de ferramentas para detectar conteúdo enganoso gerado por ela.

“Toda ferramenta tecnológica pode ser usada para fins lícitos ou ilícitos, não somente a inteligência artificial. Isso não significa que devemos simplesmente banir o seu uso de maneira radical, mas avaliar os objetivos e pensar em um ambiente seguro e confiável para o seu uso”, afirma Paula Rodrigues, especialista em direito digital e sócia da Daniel Advogados.

Embora a OpenAI tenha revelado poucas informações sobre o desenvolvimento do Sora, seu lançamento coincide com processos judiciais contra a empresa e sua parceira Microsoft, relacionados ao uso de obras protegidas por direitos autorais para treinar o ChatGPT.

Sora marca um avanço significativo e levanta questões importantes sobre o mercado de direitos autorais e as temidas deepfakes, principalmente em ano de eleições.