A nossa voz é uma de nossas características mais marcantes. Tem gente que nasce com a sorte de ter uma voz incrível, digna de ser um cantor de ópera, e há quem tenha uma voz mais "normal". Nesse sentido, é bem provável que você já tenha tentado imaginar como é uma pessoa só pela voz - seja baseado em experiências anteriores ou simplesmente usando a criatividade. Para poupar seus esforços (e fazer uma grande contribuição para a ciência, alguns pesquisadores desenvolveram a Speech2Face, uma inteligência artificial (IA) capaz de criar rostos baseados em vozes.
Como funciona a Speech2Face?
A Speech2Face consiste em uma rede neural que foi treinada com vozes de mais de 100.000 pessoas mostradas em milhões de vídeos. Assim, ela foi capaz de associar as vozes aos rostos. Apesar disso, a inteligência artificial não sabe exatamente como é o indivíduo apenas pela voz. Ela reconhece na fala características como idade, gênero, etnia e mais. Com isso, os rostos são resultados “médios”, genéricos e não exatos.
Na verdade, a tecnologia por trás da Speech2Face ainda é muito recente e está longe da perfeição. Por exemplo, quando recebeu amostras de uma mesma pessoa falando chinês e depois em inglês, não conseguiu reproduzir a mesma face. Pelo contrário, gerou duas faces diferentes: a primeira foi uma asiática e a segunda de um homem branco.
Além disso, há um viés de gênero no algoritmo. Ele tem uma tendência a associar baixa frequência a rostos masculinos e vozes agudas a rostos femininos. Ainda, os pesquisadores afirmam que a inteligência artificial foi treinada somente com vídeos do YouTube, que não representa toda a população mundial.
É o começo, mas a pesquisa já indica resultados promissores. Como quase toda ferramenta de inteligência artificial, há prós e contras. Ela pode ser muito útil para pesquisas e softwares de reconhecimento, mas também pode ser usada com más intenções. Um exemplo seria para a elaboração de fake news, como vídeos publicados na internet.
Os resultados da pesquisa foram publicados online na plataforma arXiv. Ainda, há uma página explicativa sobre o Speech2Face que apresenta o link com o artigo e acesso ao material suplementar (com as figuras, gráficos e áudios).
LEIA MAIS
Fontes: Speech2Face; Science Times.