Início Ciência e tecnologia ‘Explicativo’ Ai Sticky’s Secret’s Secret Language Racks

‘Explicativo’ Ai Sticky’s Secret’s Secret Language Racks

15
0

Um equipamento de IA forma um grampo pegajoso semelhante às pessoas associadas à doença de Alzheimer e um passo à frente para traduzir as proteínas do idioma que usam para determinar se cerca de cinquenta outras doenças humanas formam grampos pegajosos. Ao sair dos modelos gerais de IA de “caixa preta”, novos equipamentos, a Cania foi projetada para poder explicar suas decisões, revela padrões químicos específicos que executam ou impedem dobras de proteínas prejudiciais.

Esta invenção, publicada hoje no Journal of the Science Advances, foi graças ao maior data de dados de todos os tempos no resumo de proteínas. O estudo fornece novas idéias aos processos moleculares que incluem proteínas pegajosas, associadas a doenças que afetam meio bilhão de pessoas em todo o mundo.

O aperto de proteínas, ou soma amilóide, é um risco à saúde que interrompe o funcionamento das células comuns. Quando manchas específicas de proteína são ligadas uma à outra, as proteínas crescem em pessoas fibrosas mais espessas cujas consequências patológicas.

Embora a pesquisa tenha alguns efeitos para acelerar as tentativas de pesquisa para doenças de neurodigenamento, ela terá uma biotecnologia de impacto imediato adicional. Muitos medicamentos são proteínas e geralmente são interrompidos por aglomerados indesejados.

“A soma da proteína para agências farmacêuticas é uma grande dor de cabeça”, diz o vice -autor do Instituto de Catalunha (IBEC) do Instituto de Biozering e o líder do grupo, Dr. Beden Bowlognesi.

“Se uma proteína terapêutica começar a combinar, os lotes de produção podem falhar, gastar tempo e dinheiro. Os anticorpos e enzimas da Cania podem ajudar a orientar o engenheiro que pode estar junto e o processo tem menos probabilidade de reduzir a catástrofe cara”, acrescentou.

Os grampos de proteínas são formados usando uma linguagem mal sobrecarregada. As proteínas são feitas de vinte tipos diferentes de aminoácidos. Criar linguagem de DNA possui vinte caracteres separados em uma linguagem de proteínas, em vez da forma comum A, C, G, T, na qual a palavra “palavra” ou “motivos” se forma.

Os pesquisadores há muito tentam entender que a combinação de motivos é a causa do aperto e outros podem dobrar a proteína sem defeitos. As ferramentas de inteligência artificial que tratam aminoácidos, como um alfabeto misterioso da linguagem, podem ajudar a detectar palavras ou motivos responsáveis, mas a qualidade dos dados necessários para alimentar os modelos foi limitada ao histórico de qualidade e volume escasso ou muito pequeno proteína.

O estudo abordou esse desafio, realizando experimentos em larga escala. Os autores do estudo fizeram cada 20 aminoácidos do zero para mais de 100.000 proteínas aleatórias completas. Cada seção sintética foi testada em células de levedura viva quanto a grampo. Se uma seção específica começar a formar um grampo, as células de levedura crescerão de uma certa maneira que os pesquisadores podem medir para determinar a causa e o efeito.

Cerca de uma das peças de cada cinco proteínas (21.936/100.000) causa um aperto, o restante não. Estudos anteriores podem rastrear um punhado de seqüências, mas o novo conjunto de dados captura muitos grandes catálogos de diferentes variantes de proteínas que podem causar integração amlóide.

“Fizemos um pedaço de verdadeira proteína aleatória com muitas versões que não são encontradas na natureza. A evolução acabou de pesquisar uma parte de todas as seqüências de proteínas possíveis, enquanto nossas opiniões ajudam a apresentar nossas possibilidades a uma galáxia maior, fornecendo muitos pontos de dados para entender o comportamento mais comum do comportamento coletivo”, os primeiros autores do estudo e do pós -documental. Mike Thompson explicou.

Uma grande quantidade de dados gerados a partir dos testes foi usada para treinar a cania. Os pesquisadores decidiram torná -lo usando os princípios de “IA interpretável”, tornando seus processos de tomada de decisão transparentes e compreensíveis para as pessoas. Isso significa desistir de um pouco de sua energia previsível, que geralmente é mais sobre as AIs “Black-Box”. No entanto, cerca de 15% da cania provou ser precisa do que o modelo existente.

Especificamente, a Cania é um modelo de agendamento de convenções, uma ferramenta híbrida empréstimo de dois ângulos distintos de IA. Os modelos de convolução, como o reconhecimento da imagem, examinam as fotos dos recursos ou do nariz para detectar um rosto; nesse caso, os esquemas de cania devem encontrar recursos significativos como motivos ou “palavra” através de cadeias de proteínas.

Os modelos de ATE AI são usados ​​pelas ferramentas de tradução de idiomas para identificar as frases originais em uma frase antes de decidir a melhor tradução. Os pesquisadores incluem essa técnica para ajudar a Cainia que determina quais motivos são os mais importantes no grande esquema de toda a proteína.

Juntos, esses dois métodos ajudam a examinar os motivos locais ao identificar a importância de sua imagem maior. Quaisquer motivos na cadeia de proteínas incentivaram o aglomerado, bloquearam ou incentivaram qualquer coisa nela, mas não puderam usar essas informações para prever, mas entendem o porquê.

Por exemplo, a cânia mostrou que pequenos bolsos de aminoácidos de raios aquáticos têm maior probabilidade de arremessar a provocação, enquanto alguns motivos têm um impacto maior no aperto quando a última sequência de proteínas está próxima do início da sequência de proteínas. As observações são integradas a pesquisadores de pesquisa anteriores sob o microscópio em fibríulas amilóides familiares.

No entanto, as novas regras para a proteína Canyia também foram encontradas. Por exemplo, pensa -se que os blocos de construção específicos de proteínas, de modo que os aminoácidos carregados com chamados impedem o aglomeração. No entanto, no contexto de outros edifícios específicos, eles podem realmente promover o aglomeração.

Na forma atual, a Cania explica inicialmente a soma da proteína em um sim ou em qualquer termos, ou seja, atua como o “classificado” chamado assim. Os próximos pesquisadores desejam refinar o sistema para que ele possa prever e comparar o movimento de integração, e não apenas a possibilidade de integração. Pode ajudar a prever que uma variante de proteína produz rapidamente grampos e o que a torna mais lentamente, uma causa importante de doenças neurodizerrativas em que o tempo da formação do amlóide se torna mais importante.

“Existem 1024 maneiras de quintilion de fazer uma seção de proteínas de 20 aminoácidos de comprimento, mas demos um treinamento de IA com apenas 100.000 peças.

“Este projeto é um ótimo exemplo de como esse projeto pode acelerar a combinação de geração de dados em larga escala com a IA. É uma co-autoridades do líder do grupo e do Instituto Sangar do Sangar e do líder do grupo, o professor de pesquisa da ICREA, Ben Lehnar, disse”.

“Usando a síntese e o seqüenciamento de DNA, podemos fazer milhares de testes em um único tubo, os modelos de IA criam nossos dados necessários para o treinamento. Esse é um método que estamos solicitando a muitos problemas difíceis de biologia. O objetivo é tornar a biologia previsível e programável”, acrescentou.

O estudo é uma tentativa conjunta do Centro de Laboratório de Regulamentação Genômica (CRG) do Professor de Pesquisa da ICREA e do Instituto de Biozer da Catalunha (IBEC), o laboratório de Benetta Bolognesi. Pesquisadores do Cold Spring Harbor Laboratory (CSHL) e Welcome Sanger Institute também ajudaram neste estudo. Foi financiado pela Fundação de Pesquisa “La Kaxa”, pelo Conselho Europeu de Pesquisa e pelo Ministério da Ciência e Inovação Espanhola.

Source link