Engenharia 360

ESCOLHA A ENGENHARIA
DO SEU INTERESSE

Digite sua Busca

Speech2Face: IA gera rostos por meio da voz das pessoas

por Larissa Fereguetti | 25/06/2019
Copiado!

A nossa voz é uma de nossas características mais marcantes. Tem gente que nasce com a sorte de ter uma voz incrível, digna de ser um cantor de ópera, e há quem tenha uma voz mais “normal”. Nesse sentido, é bem provável que você já tenha tentado imaginar como é uma pessoa só pela voz – seja baseado em experiências anteriores ou simplesmente usando a criatividade. Para poupar seus esforços (e fazer uma grande contribuição para a ciência, alguns pesquisadores desenvolveram a Speech2Face, uma inteligência artificial (IA) capaz de criar rostos baseados em vozes.

Como funciona a Speech2Face?

A Speech2Face consiste em uma rede neural que foi treinada com vozes de mais de 100.000 pessoas mostradas em milhões de vídeos. Assim, ela foi capaz de associar as vozes aos rostos. Apesar disso, a inteligência artificial não sabe exatamente como é o indivíduo apenas pela voz. Ela reconhece na fala características como idade, gênero, etnia e mais. Com isso, os rostos são resultados “médios”, genéricos e não exatos.

Speech2Face
Imagem: edmtunes.com

Na verdade, a tecnologia por trás da Speech2Face ainda é muito recente e está longe da perfeição. Por exemplo, quando recebeu amostras de uma mesma pessoa falando chinês e depois em inglês, não conseguiu reproduzir a mesma face. Pelo contrário, gerou duas faces diferentes: a primeira foi uma asiática e a segunda de um homem branco.

Além disso, há um viés de gênero no algoritmo. Ele tem uma tendência a associar baixa frequência a rostos masculinos e vozes agudas a rostos femininos. Ainda, os pesquisadores afirmam que a inteligência artificial foi treinada somente com vídeos do YouTube, que não representa toda a população mundial.

É o começo, mas a pesquisa já indica resultados promissores. Como quase toda ferramenta de inteligência artificial, há prós e contras. Ela pode ser muito útil para pesquisas e softwares de reconhecimento, mas também pode ser usada com más intenções. Um exemplo seria para a elaboração de fake news, como vídeos publicados na internet.

Speech2Face
Imagem: speech2face.github.io

Os resultados da pesquisa foram publicados online na plataforma arXiv. Ainda, há uma página explicativa sobre o Speech2Face que apresenta o link com o artigo e acesso ao material suplementar (com as figuras, gráficos e áudios).

Referências: Speech2Face; Science Times.

Copiado!
Engenharia 360

Larissa Fereguetti

Doutoranda, mestre e engenheira. Fascinada por tecnologia, curiosidades sem sentido e cultura (in)útil. Viciada em livros, filmes, séries e chocolate. Acredita que o conhecimento é precioso e que o bom humor é uma ferramenta indispensável para a sobrevivência.

Comentários