Um vídeo criado com recursos de IA (inteligência artificial) recriaram a menina Sophia Jesus Ocampos, de 2 anos, para que ela contasse com detalhes como foi a própria morte, ocorrida em janeiro deste ano, em Campo Grande. De acordo com a Polícia Civil, antes de morrer, a criança foi estuprada.
Replicado por perfis no TikTok, o vídeo de Sophia foi postado por Igor de Andrade, marido de Jean Carlos Ocampo, pai da menina. A mãe de Sophia, Stephanie de Jesus Da Silva, e seu companheiro, Christian Campoçano Leitheim, são os acusados pelo crime e estão presos preventivamente.
Esse é mais um exemplo de uma tendência macabra nascida no Tiktok, em que vítimas de crimes brutais são recriadas com IA para narrar como foram assassinados. O mesmo tipo de vídeo já havia sido feito por uma página retratando as mortes do jornalista Tim Lopes, da atriz Daniella Perez e da menina Isabella Nardoni.
No vídeo postado por Andrade, que se considerava um pai afetivo à Sophia, a menina aparece em uma imagem estática, mas falando. Uma voz infantil relata tudo o que aconteceu, segundo a versão dele e do pai biológico de Sophia. Imagens de Sophia brincando com Jean e Igor também aparecem enquanto ela fala.
A tecnologia utilizada nesse caso foi a labialização. Na prática, um áudio pode ser gravado por qualquer pessoa e convertido em voz infantil, com o uso de aplicativos. Posteriormente, com o auxílio de inteligência artificial, uma foto é animada para parecer que está falando.
A técnica é idêntica à do app viral Wombo, que faz pessoas retratadas em fotos cantarem. Já a imagem da menina, ao que tudo indica, foi criada por alguma plataforma de IA que gera imagens.
Essa forma de gerar conteúdo digital usando voz e rosto de uma pessoa têm gerado preocupações, pois costuma ser usada para gerar informação falsa.
Outra forma de produzir conteúdos sintéticos seriam as “deep fakes”, quando o rosto de alguém é recriado de forma digital e posicionado, em um vídoe, no corpo de uma pessoa real.
Para esta técnica, mais sofisticada, é necessário alimentar um um modelo de inteligência artificial com milhares de imagens. A partir daí, ele gera réplicas digitais da imagem da pessoa e a faz “falar”. Assim, alguém pode ser colocado em um lugar que nunca esteve e até falar algo que nunca disse de fato.