Speech2Face: IA gera rostos por meio da voz das pessoas

A nossa voz é uma de nossas características mais marcantes. Tem gente que nasce com a sorte de ter uma voz incrível, digna de ser um cantor de ópera, e há quem tenha uma voz mais "normal". Nesse sentido, é bem provável que você já tenha tentado imaginar como é uma pessoa só pela voz - seja baseado em experiências anteriores ou simplesmente usando a criatividade. Para poupar seus esforços (e fazer uma grande contribuição para a ciência, alguns pesquisadores desenvolveram a Speech2Face, uma inteligência artificial (IA) capaz de criar rostos baseados em vozes.

Como funciona a Speech2Face?

A Speech2Face consiste em uma rede neural que foi treinada com vozes de mais de 100.000 pessoas mostradas em milhões de vídeos. Assim, ela foi capaz de associar as vozes aos rostos. Apesar disso, a inteligência artificial não sabe exatamente como é o indivíduo apenas pela voz. Ela reconhece na fala características como idade, gênero, etnia e mais. Com isso, os rostos são resultados “médios”, genéricos e não exatos.

CONTINUE LENDO ABAIXO

Na verdade, a tecnologia por trás da Speech2Face ainda é muito recente e está longe da perfeição. Por exemplo, quando recebeu amostras de uma mesma pessoa falando chinês e depois em inglês, não conseguiu reproduzir a mesma face. Pelo contrário, gerou duas faces diferentes: a primeira foi uma asiática e a segunda de um homem branco.

Além disso, há um viés de gênero no algoritmo. Ele tem uma tendência a associar baixa frequência a rostos masculinos e vozes agudas a rostos femininos. Ainda, os pesquisadores afirmam que a inteligência artificial foi treinada somente com vídeos do YouTube, que não representa toda a população mundial.

É o começo, mas a pesquisa já indica resultados promissores. Como quase toda ferramenta de inteligência artificial, há prós e contras. Ela pode ser muito útil para pesquisas e softwares de reconhecimento, mas também pode ser usada com más intenções. Um exemplo seria para a elaboração de fake news, como vídeos publicados na internet.

Os resultados da pesquisa foram publicados online na plataforma arXiv. Ainda, há uma página explicativa sobre o Speech2Face que apresenta o link com o artigo e acesso ao material suplementar (com as figuras, gráficos e áudios).

CONTINUE LENDO ABAIXO

Comentários

Larissa Fereguetti

Cientista e Engenheira de Saúde Pública, com mestrado, também doutorado em Modelagem Matemática e Computacional; com conhecimento em Sistemas Complexos, Redes e Epidemiologia; fascinada por tecnologia.

Speech2Face: IA gera rostos por meio da voz das pessoas

Speech2Face: IA gera rostos por meio da voz das pessoas

Como funciona a Speech2Face?

LEIA MAIS

5 comandos que você NÃO imaginava que a Alexa faz

8 extensões do Google Chrome para otimizar seu trabalho como engenheiro

Comentários

Larissa Fereguetti

FIQUE POR DENTRO

Últimas Matérias

Os 12 maiores monumentos da engenharia de Paris

Conheça as 5 Melhores Escolas de Engenharia da França

Veja os detalhes de engenharia e arquitetura da Vila Olímpica de Paris 2024

Sistema inovador de blocos de madeira permite construir casas de forma rápida e fácil

LEIA O PRÓXIMO ARTIGO

Matérias Relacionadas

5 comandos que você NÃO imaginava que a Alexa faz

8 extensões do Google Chrome para otimizar seu trabalho como engenheiro

Apple lança mapas 3D de Paris para as Olimpíadas 2024, unindo turismo e tecnologia

"Nariz artificial" brasileiro pode identificar alimentos estragados na geladeira

Descoberta inovadora usa minúscula lente para detectar gases na atmosfera

7 Soluções inovadoras de Engenharia para os Jogos Olímpicos de Paris 2024

Refrigeração em Estado Sólido: O que é e Como Funciona?

Despertador inteligente da Amazon chega ao Brasil com tecnologia avançada

Continue lendo

Impressoras 3D podem começar a fabricar medicamentos

Tecnologia e Inovação