Na era de big data, a engenharia e a ciência vem trilhando um caminho de reconhecimento de padrões, em busca melhor organizar e compreender dados. O que a gente não costuma imaginar é que, longe do chão de fábrica e cadeias produtivas, há sistemas biológicos microscópicos, como colônias de bactérias, podem constituir fontes de dados complexos e de difícil interpretação, exigindo interdisciplinaridade profissional e ferramentas sofisticadas, como o aprendizado de máquina.
Nessa linha de pesquisa, uma equipe de engenharia biomédica da Duke University desenvolveu uma abordagem de aprendizado de máquina para modelar as interações entre variáveis complexas em bactérias manipuladas que, de outra forma, seriam muito difíceis de prever. Seus algoritmos são generalizáveis para muitos tipos de sistemas biológicos.
No estudo, os pesquisadores treinaram uma rede neural para prever os padrões circulares criados por um circuito biológico incorporado a uma cultura bacteriana. O sistema trabalhou 30.000 vezes mais rápido que o modelo computacional existente. Para melhorar ainda mais a precisão, a equipe desenvolveu um método para treinar o modelo de machine learning várias vezes para comparar suas respostas. O desafio enfrentado foi determinar qual conjunto de parâmetros poderia produzir um padrão específico em uma cultura de bactérias após um circuito genético modificado.
Modelando sistemas biológicos:
Em um trabalho anterior, desenvolvido no mesmo laboratório, os pesquisadores e estudantes “programavam” bactérias para produzir proteínas que, dependendo das especificidades do meio de cultura, interagem entre si para formar anéis. Ao controlar variáveis como o tamanho do meio de crescimento e a quantidade de nutrientes fornecidos, os cientistas descobriram poderem controlar a espessura do desse halo de bactérias, determinar o tempo de crescimento, dentre outras coisas.
Ao alterar algumas variáveis em potencial, os
pesquisadores descobriram que poderiam fazer mais, como causar a formação de
dois ou até três anéis. Porém, como uma única simulação em computador levou
cinco minutos, tornou-se impraticável procurar por um resultado específico em
um design experimental grande. Em bancada, há o uso de reagentes e equipamentos
caros e que precisam de profissionais especializados para manipulação. Daí a
importância de empregar ferramentas computacionais de previsão de
comportamento.
Diante dessa demanda, o estudo foi conduzido sobre um
sistema de 13 variáveis bacterianas, como taxas de crescimento, difusão,
degradação de proteínas e movimento celular. Bem biológico. Mas só para
calcular seis valores por parâmetro, um único computador levaria mais de 600
anos. Mas aí vem a ciência de dados: A execução em um cluster de computadores
paralelos com centenas de nós pode reduzir o tempo de execução para vários
meses, mas o aprendizado de máquina pode reduzir para horas.
PUBLICIDADE
CONTINUE LENDO ABAIXO
LEIA MAIS
Pulando para o que interessa:
O modelo padrão usado é lento porque requer que sejam
consideradas etapas intermediárias no tempo a uma taxa pequena o suficiente
para que seja preciso. Mas essas etapas intermediárias nem sempre são tão
importantes. Por vezes, apenas interessam os resultados finais para certas
aplicações. Além disso, é possível retroceder e descobrir o que aconteceu no
meio do caminho, caso os resultados finais sejam um indicativo de que esses
estágios devam ser avaliados.
Para pular para os resultados finais, a equipe se voltou
para um modelo de aprendizado de máquina que pode efetivamente fazer previsões
muito mais rápidas do que o modelo original. A rede usa variáveis de modelo
como entrada, atribui inicialmente pesos e desvios aleatórios e fornece uma
previsão de qual padrão a colônia bacteriana formará, ignorando completamente
as etapas intermediárias que levam ao padrão final.
Para lidar com as poucas instâncias em que o aprendizado de
máquina erra, os pesquisadores criaram uma maneira de verificar rapidamente seu
trabalho. Para cada rede neural, o processo de aprendizagem tem um elemento de
aleatoriedade. Em outras palavras, ele nunca aprenderá da mesma maneira duas
vezes, mesmo se for treinado no mesmo conjunto de respostas.
Transformando biologia em matemática, quatro redes neurais foram treinadas e suas respostas foram comparadas para cada instância. Com isso, verificou-se que, quando as redes neurais treinadas fazem previsões semelhantes, essas previsões estão próximas da resposta certa. Interpretou-se, portanto, que não seria necessário validar cada resposta com o modelo computacional mais lento, de forma que a equipe podia confiar no que chamou de “sabedoria da multidão”.
PUBLICIDADE
CONTINUE LENDO ABAIXO
Com o modelo de aprendizado de máquina treinado e corroborado, os pesquisadores decidiram usá-lo para fazer novas investigações sobre o sistema biológico em estudo. E a gente acompanha esse tipo de inovação, aguardando novas maneiras de implementar ferramentas úteis para as mais diversas áreas.
Fontes: Nature Communications.
Comentários
Kamila Jessie
Doutora em Hidráulica e Saneamento pela Universidade de São Paulo (EESC/USP) e Mestre em Ciências pela mesma instituição; é formada em Engenharia Ambiental e Sanitária pelo Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG) com período sanduíche na University of Ottawa, no Canadá; possui experiência em tratamentos físico-químicos de água e efluentes; atualmente, integra o Centro de Pesquisa em Óptica e Fotônica (CePOF) do Instituto de Física de São Carlos (USP), onde realiza estágio pós-doutoral no Biophotonics Lab.