Engenharia 360

ESCOLHA A ENGENHARIA
DO SEU INTERESSE

Digite sua Busca

Machine learning permite prever o comportamento de sistemas biológicos

por Kamila Jessie | 31/10/2019
Copiado!

Na era de big data, a engenharia e a ciência vêm trilhando um caminho de reconhecimento de padrões, em busca melhor organizar e compreender dados. O que a gente não costuma imaginar é que, longe do chão de fábrica e cadeias produtivas, há sistemas biológicos microscópicos, como colônias de bactérias, podem constituir fontes de dados complexos e de difícil interpretação, exigindo interdisciplinaridade profissional e ferramentas sofisticadas, como o aprendizado de máquina.

circuitos biológicos machine learning
Imagem: techxplore.com

Nessa linha de pesquisa, uma equipe de engenharia biomédica da Duke University desenvolveu uma abordagem de aprendizado de máquina para modelar as interações entre variáveis ​​complexas em bactérias manipuladas que, de outra forma, seriam muito difíceis de prever. Seus algoritmos são generalizáveis ​​para muitos tipos de sistemas biológicos.

No estudo, os pesquisadores treinaram uma rede neural para prever os padrões circulares que seriam criados por um circuito biológico incorporado a uma cultura bacteriana. O sistema trabalhou 30.000 vezes mais rápido que o modelo computacional existente. Para melhorar ainda mais a precisão, a equipe desenvolveu um método para treinar o modelo de machine learning várias vezes para comparar suas respostas. O desafio enfrentado foi determinar qual conjunto de parâmetros poderia produzir um padrão específico em uma cultura de bactérias após um circuito genético modificado.

Modelando sistemas biológicos:

Em um trabalho anterior, desenvolvido no mesmo laboratório, os pesquisadores e estudantes “programavam” bactérias para produzir proteínas que, dependendo das especificidades do meio de cultura, interagem entre si para formar anéis. Ao controlar variáveis ​​como o tamanho do meio de crescimento e a quantidade de nutrientes fornecidos, os cientistas descobriram que podiam controlar a espessura do desse halo de bactérias, determinar o tempo de crescimento, dentre outras coisas.

Imagem: techxplore.com

Ao alterar algumas variáveis ​​em potencial, os pesquisadores descobriram que poderiam fazer mais, como causar a formação de dois ou até três anéis. Porém, como uma única simulação em computador levou cinco minutos, tornou-se impraticável procurar por um resultado específico em um design experimental grande. Em bancada, há o uso de reagentes e equipamentos caros e que precisam de profissionais especializados para manipulação. Daí a importância de empregar ferramentas computacionais de previsão de comportamento.

Diante dessa demanda, o estudo foi conduzido sobre um sistema de 13 variáveis ​​bacterianas, como taxas de crescimento, difusão, degradação de proteínas e movimento celular. Bem biológico. Mas só para calcular seis valores por parâmetro, um único computador levaria mais de 600 anos. Mas aí vem a ciência de dados: A execução em um cluster de computadores paralelos com centenas de nós pode reduzir o tempo de execução para vários meses, mas o aprendizado de máquina pode reduzir para horas.

Pulando para o que interessa:

O modelo padrão usado é lento porque requer que sejam consideradas etapas intermediárias no tempo a uma taxa pequena o suficiente para que seja preciso. Mas essas etapas intermediárias nem sempre são tão importantes. Por vezes, apenas interessam os resultados finais para certas aplicações. Além disso, é possível retroceder e descobrir o que aconteceu no meio do caminho, caso os resultados finais sejam um indicativo de que esses estágios devam ser avaliados.

Para pular para os resultados finais, a equipe se voltou para um modelo de aprendizado de máquina que pode efetivamente fazer previsões muito mais rápidas do que o modelo original. A rede usa variáveis ​​de modelo como entrada, atribui inicialmente pesos e desvios aleatórios e fornece uma previsão de qual padrão a colônia bacteriana formará, ignorando completamente as etapas intermediárias que levam ao padrão final.

Para lidar com as poucas instâncias em que o aprendizado de máquina erra, os pesquisadores criaram uma maneira de verificar rapidamente seu trabalho. Para cada rede neural, o processo de aprendizagem tem um elemento de aleatoriedade. Em outras palavras, ele nunca aprenderá da mesma maneira duas vezes, mesmo se for treinado no mesmo conjunto de respostas.

circuitos biológicos machine learning
Imagem: nature.com

Transformando biologia em matemática, quatro redes neurais foram treinadas e suas respostas foram comparadas para cada instância. Com isso, verificou-se que, quando as redes neurais treinadas fazem previsões semelhantes, essas previsões estão próximas da resposta certa. Interpretou-se, portanto, que não seria necessário validar cada resposta com o modelo computacional mais lento, de forma que a equipe podia confiar no que chamou de “sabedoria da multidão”.

Com o modelo de aprendizado de máquina treinado e corroborado, os pesquisadores decidiram usá-lo para fazer novas investigações sobre o sistema biológico em estudo. E a gente acompanha esse tipo de inovação, aguardando novas maneiras de implementar ferramentas úteis para as mais diversas áreas.

Fonte: Nature Communications.

Copiado!
Engenharia 360

Kamila Jessie

Engenheira ambiental e sanitarista, MSc. e atualmente doutoranda em Engenharia Hidráulica e Saneamento pela Universidade de São Paulo. http://orcid.org/0000-0002-6881-4217

Comentários