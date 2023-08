Diego Sousai Diego Sousa https://istoe.com.br/autor/diego-sousa/ 07/08/2023 - 5:57 Compartilhe

Os humanos são incapazes de detectar mais de um quarto das amostras de fala deepfake feitas por inteligência artificial, de acordo com uma nova pesquisa da University College London (UCL).

Na tecnologia “deepfake”, “uma pessoa em uma imagem ou vídeo é trocada pela aparência de outra pessoa”, de acordo com o Instituto de Tecnologia de Massachusetts. A técnica também foi usada para recriar as vozes das pessoas para golpes.

O novo estudo da UCL, publicado na semana passada na revista PLOS One , usou um algoritmo de conversão de texto em fala treinado em dois conjuntos de dados disponíveis publicamente para criar 50 amostras de fala deepfake em inglês e mandarim.

As amostras foram tocadas para 529 participantes do estudo que tentaram decifrar as vozes reais das falsas.

Os participantes só conseguiram identificar a fala falsa em 73% das vezes, melhorando ligeiramente apenas depois de receberem treinamento sobre como reconhecer vozes deepfake.

“Nossas descobertas confirmam que os humanos são incapazes de detectar de forma confiável a fala deepfake, tenham ou não recebido treinamento para ajudá-los a identificar conteúdo artificial”, disse Kimberly Mai, autora do estudo e estudante de doutorado em aprendizado de máquina na UCL, disse em uma declaração .

“Também vale a pena notar que as amostras que usamos neste estudo foram criadas com algoritmos relativamente antigos, o que levanta a questão de saber se os humanos seriam menos capazes de detectar a fala deepfake criada usando a tecnologia mais sofisticada disponível agora e no futuro”, completou Mai.

O estudo britânico é considerado o primeiro a explorar a capacidade dos humanos de detectar a fala gerada artificialmente em um idioma diferente do inglês.

Os falantes de inglês e mandarim mostraram taxas de detecção semelhantes, mas os falantes de inglês frequentemente faziam referência à respiração, enquanto os falantes de mandarim notavam a cadência quando questionados sobre seus métodos de decodificação.

Os pesquisadores da UCL alertam que a tecnologia deepfake está ficando cada vez mais forte, já que os algoritmos pré-treinados mais recentes “podem recriar a voz de uma pessoa usando apenas um clipe de 3 segundos dela falando”.

Os cientistas querem criar detectores de fala automatizados mais fortes para melhor combater possíveis ameaças.

“Com a tecnologia de inteligência artificial generativa ficando mais sofisticada e muitas dessas ferramentas disponíveis abertamente, estamos prestes a ver inúmeros benefícios, bem como riscos”, disse Lewis Griffin, professor da UCL, autor sênior do estudo.

“Seria prudente que governos e organizações desenvolvessem estratégias para lidar com o abuso dessas ferramentas, certamente, mas também devemos reconhecer as possibilidades positivas que estão no horizonte.”

De acordo com alguns especialistas, os deepfakes estão prestes a desempenhar um papel perigoso nas eleições de 2024.

Em março, a plataforma de compartilhamento de vídeos TikTok proibiu deepfakes de jovens .

A medida ocorre em meio à proliferação de golpes que usam deepfakes para assustar as pessoas e levá-las a entregar dinheiro ou imagens pornográficas de si mesmas.





