No primeiro teste real de inteligência artificial na investigação em saúde, cientistas da UC San Francisco e da Wayne State University descobriram que a IA generativa pode processar conjuntos de dados médicos muito mais rapidamente do que as equipas tradicionais de ciência da computação – e em alguns casos produzir resultados mais robustos. Especialistas humanos conseguiram analisar os mesmos dados durante vários meses.
Para comparar diretamente o desempenho, os pesquisadores atribuíram tarefas idênticas a grupos diferentes. Algumas equipes confiaram inteiramente na experiência humana, enquanto outras usaram cientistas que trabalhavam com ferramentas de IA. O desafio era prever o nascimento prematuro utilizando dados de mais de 1.000 mulheres grávidas.
Até mesmo uma dupla de pesquisadores juniores formada por um estudante de mestrado da UCSF, Ruben Sarwal, e um estudante do ensino médio, Viktor Tarka, desenvolveu com sucesso modelos de previsão com suporte de IA. O sistema gera código de computador funcional em minutos – algo que normalmente levaria horas ou até dias para programadores experientes.
O benefício vem da capacidade da IA de escrever código analítico com base em prompts curtos, mas altamente específicos. Nem todo sistema funciona bem. Apenas 4 dos 8 chatbots de IA geraram código utilizável. No entanto, aqueles que tiveram sucesso não precisaram de uma grande equipa de especialistas para os orientar.
Devido a essa velocidade, os pesquisadores juniores conseguiram concluir seus experimentos, validar seus resultados e enviar suas descobertas para um periódico em poucos meses.
“Essas ferramentas de IA podem aliviar um dos maiores obstáculos da ciência de dados: construir nosso pipeline de análise”, disse Marina Sirota, PhD, professora de pediatria que é diretora interina do Bakker Computational Health Sciences Institute (BCHSI) da UCSF e investigadora principal do March of Dimesat UCSF Principal Research Center. “A aceleração não pode chegar tão cedo para os pacientes que precisam de ajuda agora”.
Sirota é co-autor sênior do estudo, publicado Medicina de relatório celular Em 17 de fevereiro
Por que o nascimento prematuro é objeto de pesquisa
A aceleração da análise de dados poderia melhorar as ferramentas de diagnóstico do nascimento prematuro – a principal causa de morte neonatal e um dos principais contribuintes para os desafios motores e cognitivos a longo prazo das crianças. Nos Estados Unidos, cerca de 1.000 bebês nascem prematuramente todos os dias.
Os pesquisadores ainda não entendem completamente o que causa o nascimento prematuro. Para investigar potenciais factores de risco, a equipa de Sirota compilou dados do microbioma de quase 1.200 mulheres grávidas cujos resultados foram acompanhados em nove estudos separados.
“Este tipo de trabalho só é possível através do compartilhamento aberto de dados, combinando as experiências de muitas mulheres e a experiência de muitos pesquisadores”, disse Tomiko T. Oskotsky MD, codiretora do Repositório de Dados de Nascimento Prematuro March of Dimes, professora associada da UCSF BCHSI e coautora do artigo.
No entanto, analisar um conjunto de dados tão grande e complexo revelou-se um desafio. Para combater isso, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Diálogo sobre Avaliação e Métodos de Engenharia Reversa).
Sirota co-liderou um dos três Dream Pregnancy Challenges, concentrando-se especificamente em dados do microbioma vaginal. Mais de 100 equipes em todo o mundo participaram, desenvolvendo modelos de aprendizado de máquina projetados para identificar padrões associados ao nascimento prematuro. A maioria das equipes concluiu seu trabalho dentro do período de competição de três meses. No entanto, foram necessários quase dois anos para compilar as descobertas e publicá-las.
Testando IA em dados de gravidez e microbioma
Curioso para saber se a IA generativa poderia encurtar esse cronograma, o grupo de Sirota fez parceria com pesquisadores liderados pelo co-autor sênior e professor Adi El Tarka, Ph.D., do Centro de Medicina Molecular e Genética da Wayne State University na Wayne State University em Detroit. Tarka liderou dois outros Dream Challenges, que se concentraram em melhorar os métodos de previsão dos estágios da gravidez.
Juntos, os pesquisadores instruíram oito sistemas de IA a gerar algoritmos de forma independente usando o mesmo conjunto de dados de três desafios DREAM sem codificação humana direta.
Os chatbots de IA recebem instruções em linguagem natural cuidadosamente escritas. Assim como o ChatGPT, os sistemas foram guiados por instruções detalhadas projetadas para orientá-los a analisar dados de saúde comparáveis aos dos participantes do sonho original.
Os seus objectivos reflectiam desafios anteriores. Os sistemas de IA analisam dados do microbioma vaginal para detectar sinais de nascimentos anteriores e examinam amostras de sangue ou de placenta para estimar a idade gestacional. A datação da gravidez é quase sempre uma suposição, mas determina que tipo de cuidados as mulheres recebem à medida que a gravidez avança. Quando o palpite está errado, a preparação para o parto fica mais difícil.
Os pesquisadores então executaram o código gerado pela IA usando o conjunto de dados DREAM. Apenas 4 das 8 ferramentas produziram modelos que correspondiam ao desempenho da equipe humana, embora em alguns casos os modelos de IA tenham tido melhor desempenho. Todo o esforço generativo de IA – desde o início até o envio de um artigo – levou apenas seis meses.
Os cientistas sublinham que a IA ainda precisa de uma supervisão cuidadosa. Estes sistemas podem produzir resultados enganosos e a habilidade humana é essencial. No entanto, ao classificar rapidamente enormes conjuntos de dados de saúde, a IA generativa pode gastar menos tempo com os pesquisadores solucionando problemas de código, interpretando resultados e fazendo perguntas científicas significativas.
“Graças à IA generativa, pesquisadores com experiência limitada em ciência de dados nem sempre precisam criar colaborações extensas ou passar horas depurando código”, disse Tarka. “Eles podem se concentrar em responder às questões biomédicas certas.”
Autores: UCSF Os autores são Ruben Sarwal; Claire Dubin; Sanchita Bhattacharya, MS; e Atul Batte, MD, Ph.D. Outros autores são Victor Tarka (Huron High School, Ann Arbor, MI); Nicholas Kalavros e Gustavo Stolovitsky, PhD (Universidade de Nova York); Gaurav Bhatti (Universidade Estadual Wayne); e Roberto Romero, MD, D(Med)Sc (Instituto Nacional de Saúde Infantil e Desenvolvimento Humano (NICHD)).
Financiamento: Este trabalho foi financiado pelo March of Dimes Prematurity Research Center da UCSF e pelo ImmPort. Os dados utilizados neste estudo foram gerados em parte com o apoio do Departamento de Pesquisa sobre Gravidez do NICHD.



