Uma pequena região do cérebro, conhecida como Zona Tigmental Ventral (VTA), desempenha um papel fundamental na maneira como processamos os prêmios. Produz dopamina, um neuromoduletor que prevê a recompensa futura com base no sinal relevante. Uma equipe de universidades de Genebra (Unis), Harvard e McGill mostrou que o VTA vai além: essa não é apenas a recompensa esperada, mas também codifica o momento esperado. Esta invenção feita por um algoritmo de aprendizado de máquina destaca o valor da inteligência artificial com a neurociência. O estudo foi publicado na revista NaturezaO
A inspiração e as recompensas cerebrais da área testamental (VTA) desempenham um papel fundamental no circuito. A principal fonte de dopamina, esse pequeno conjunto de neurônios, envia esse neuromoduletor para desencadear uma ação em resposta a uma estimulação positiva em outras regiões do cérebro.
“Inicialmente, o VTA foi considerado o único centro de recompensa cerebral. Na 9ª década, os cientistas descobriram que não codificava o próprio prêmio, mas também a previsão do prêmio”, explicou Alexandre, professor completo de departamento básico de neurociência da Faculdade de Medicina, Pougate.
Os testes em animais mostraram que, quando uma recompensa segue constantemente um sinal de luz, por exemplo, o VTA não desiste da dopamina no momento da recompensa, mas o sinal é assim que o sinal aparecer. Essa reação está associada ao prêmio – associado ao prêmio – associado ao prêmio – associado ao prêmio.
Muitas funções mais sofisticadas
Esse “reforço de aprendizado”, que requer um monitoramento mínimo, é o centro da educação humana. É também a política por trás de muitos algoritmos de inteligência artificial que melhoram o desempenho através do treinamento – como o Alfago, o primeiro algoritmo que derrota o campeão mundial no jogo dos jogos Go.
De acordo com um estudo recente, a equipe de Alexandre Pouset em colaboração com a Universidade de Paul da Universidade de Harvard e a Universidade de Paul da McGill mostra que a codificação do VTA é mais sofisticada do que os pensamentos anteriores. “Em vez de prever um yoga pesado para recompensas futuras, o VTA prevê sua evolução temporária. Em outras palavras, cada ganho é representado separadamente, onde é o momento certo”, explicou o pesquisador da Unis neste trabalho.
“Embora soubéssemos que os neurônios do VTA deram prioridade às recompensas ao longo do tempo no futuro – existem dois preços na política de um pássaro – descobrimos que diferentes neurônios o fazem em escalas em momentos diferentes, demoram mais tempo em segundos, e os outros dão uma recompensa por alguns minutos. Recompensas atrasadas permitem se adaptar ao máximo” “”
Ai e neurociência: uma estrada de duas caras
Essas pesquisas são derivadas de um diálogo eficaz entre neurociência e inteligência artificial. Alexandre Pushes criou um algoritmo matemático autêntico que inclui o tempo do processamento de recompensa. Enquanto isso, os pesquisadores de Harvard coletaram um amplo dados neurofagiológicos sobre as atividades do ATV de animais premiados.
“Então eles aplicaram nossos algoritmos aos seus dados e descobriram que os resultados eram perfeitamente combinados com sua pesquisa experiente”. Ao inspirar a IA do cérebro e as técnicas de aprendizado de máquina, esses resultados provam que os algoritmos também podem atuar como uma ferramenta poderosa para expressar nossos processos neurofagiológicos.