Um caminho visual do cérebro poderia fazer mais do que detectar objetos

Por

15 Abril 2025

Quando as informações visuais entram no cérebro, ela viaja por dois caminhos que processam diferentes aspectos da entrada. Durante décadas, os cientistas assumiram que um desses caminhos, fluxos visuais ventrais, é responsável pelo reconhecimento de objetos e só pode ser otimizado pela evolução por fazê -lo.

Em compatíveis com isso, na última década, os cientistas do MIT descobriram que, quando os modelos de anatomia do fluxo ventral são favoráveis para resolver o reconhecimento de objetos, eles são significativamente melhor proféticos das atividades neurais do fluxo ventral.

No entanto, em um novo estudo, os pesquisadores do MIT mostraram que, quando treinam esses tipos de modelos em vez de treinar esses tipos de modelos, os modelos também prevêem as atividades neurais do fluxo ventral. Ele sugere que o fluxo ventral pode não ser exclusivamente favorável para a aceitação do objeto.

“Ele expande a questão sobre o que o fluxo ventral é favorável ao fluxo ventral. Acho que muitas pessoas em nosso campo acreditam que o fluxo ventral é favorável ao reconhecimento de objetos, mas este estudo fornece uma nova visão de que o fluxo ventral também pode ser favorável ao trabalho espacial, MIT Grake.

G é o principal autor do estudo, que será apresentado na Conferência Internacional sobre Apresentação de Aprendizagem. Outros escritores de papel incluem o aluno visitante Weichen Huang através do programa do MIT Summer Institute; Estáster alter, engenheiro de software do MIT Quest for Intelligence; Jeremy Shwarz, membro da equipe técnica de pesquisa patrocinada; Joshua Tenneboum, professor de cérebro e ciência cognitiva; E James Dicarlo, Professor de Peter de Florerage de Ciências Cérebres e Cognitivas, Diretor de Inteligência de Inteligência e Membro do Instituto McGover for Brain Research of MIT.

Exceder o reconhecimento de objetos

Quando olhamos para um objeto, nosso sistema visual pode não apenas identificar o objeto, mas outros recursos como sua posição, sua distância de nós e a direção do espaço no espaço. No início dos anos sessenta, os neurocientistas assumiram que o sistema visual de primatas é dividido em duas maneiras: fluxo ventral, que executa o reconhecimento de objeto e o fluxo dorsal, que processa a localização espacial.

Na última década, os pesquisadores trabalharam para modelar fluxos ventrais usando uma espécie de modelo profundo de S-Sheikh conhecido como Rede Neural Convolucional (CNN). Os pesquisadores descrevem esses modelos, descrevendo as imagens, alimentando milhares de conjuntos de dados ilustrados, juntamente com os rótulos de categoria para realizar trabalhos de reconhecimento de objetos.

Há uma alta taxa de sucesso na classificação de imagens de versões sofisticadas desses CNNs. Além disso, os pesquisadores descobriram que as atividades internas dos modelos são muito semelhantes às atividades de neurônios que processam os dados visuais no fluxo ventral. Além disso, quanto mais semelhante ao fluxo ventral, melhor eles se apresentam em funções de reconhecimento de objetos-auto-reconhecimento. Ele conseguiu adivinhar muitos pesquisadores que a funcionalidade dominante do fluxo ventral está reconhecendo objetos.

No entanto, um estudo de estudos experimentais, especialmente do laboratório Dicarlo em 20 de 2016, descobriu que o fluxo ventral também parece codificar características espaciais. Esses recursos incluem tamanho de objeto, sua orientação (quanto é girada) e sua localização no campo da cena. Com base neste estudo, a equipe do MIT pretende investigar se o fluxo ventral poderia fornecer funções adicionais excedendo o objeto.

“Nossa pergunta central neste projeto foi: é possível que possamos pensar no fluxo ventral como favorável para realizar essas tarefas espaciais em vez de tarefas de classificação?” G diz.

Para testar essa hipótese, os pesquisadores viajaram para o treinamento da CNN para identificar uma ou mais características espaciais de um objeto com rotação, localização e distância. Para treinar modelos, eles criaram um novo conjunto de dados de imagens sintéticas. Essas imagens mostram objetos como chaleira de chá ou calculadoras em diferentes origens, em locais e orientações rotuladas para ajudá -las a aprender o modelo.

Os pesquisadores descobriram que os CNNs treinados em uma dessas funções espaciais mostraram um alto nível de “neuro-propenso” com fluxos ventrais-os modelos da CNN têm muito em comum com o nível que é treinado em reconhecimento ao objeto.

Os pesquisadores medem a neuro-presantelização usando uma técnica criada pelo laboratório de Diclo, na qual uma certa imagem está pedindo aos modelos que prevejam atividades neurais que gerarão o cérebro, uma vez treinado. Os pesquisadores descobriram que quanto melhor os modelos eles fizeram no trabalho espacial que treinaram, mais eles mostravam os sinais neuro.

“Não posso assumir que o fluxo ventral está simplesmente classificando o objeto, pois muitas dessas outras funções, como o trabalho espacial, podem levar à neuro-proliferação de modelos e suas performances para levar a fortes relações entre suas performances”, diz G. “Nossa conclusão é que você pode otimizar a classificação ou executando essas tarefas espaciais e ambas oferecem um modelo semelhante a um modelo com base em nossas métricas atuais para avaliar a neuro-prosteticação”

Para comparar o modelo

Os pesquisadores investigaram por que o reconhecimento e o treinamento de objetos para esses dois métodos de treinamento-alinhamento de treinamento para treinamento. Para fazer isso, eles fizeram uma análise conhecida como Aliança Centric Kerenel (CKA), que lhes permite medir o grau de moinhos na apresentação em vários CNN. Esta análise mostra que, no primeiro a médio, os manchas de modelos, as apresentações que os modelos aprendidos são quase diferentes.

“Nesses níveis primários, você pode basicamente dizer esses modelos apenas analisando suas apresentações”, disse G. “Parece que eles aprenderam algo muito semelhante ou integrado, apresentando nas camadas intermediárias e, no estágio próximo, eles são desviados para apoiar tarefas diferentes”.

Os pesquisadores assumiram que, quando os modelos são treinados para analisar apenas um recurso, eles também consideram os recursos “não-laksh” que não são treinados. Quando os objetos têm mais variabilidade em recursos não listados, os modelos tendem a aprender apresentações mais semelhantes com modelos treinados treinados em outras tarefas. Isso sugere que os modelos estão usando todas as informações disponíveis, o que pode trazer diferentes modelos para a mesma apresentação, dizem os pesquisadores.

G diz: “mais variabilidade não literal ajuda o modelo a aprender melhores apresentações, que, em vez de aprender uma apresentação ignorante sobre elas”, disse G. “É possível que os modelos, embora tenham sido treinados em uma meta, além de aprender outras coisas devido à variabilidade desses recursos que não Laxing” “

Em trabalhos futuros, os pesquisadores esperam desenvolver novas maneiras de comparar diferentes modelos, na esperança de aprender mais sobre como cada treinamento e treinamento desenvolve a apresentação interna do objeto com base nas diferenças de dados de treinamento.

“Ainda pode haver pequenas diferenças entre esses modelos, embora nosso método atual de medir como esses modelos seja semelhante ao cérebro nos diga que eles estão em um nível muito semelhante. Isso implica que ainda podemos fazer algum trabalho para melhorar o modelo no cérebro, para que possamos entender exatamente o que o fluxo ventral é favorável para exatamente o que é o fluxo ventral”.

O estudo foi financiado pela Semiconductor Research Corporation e pela Agência de Projetos de Pesquisa Avançada de Defesa dos EUA.

Source link

ARTIGOS RELACIONADOSMais do autor

Este estranho dinossauro gigante pode mudar o que sabemos sobre o Titã Jurássico

Cientistas dizem que esta alga pode remover microplásticos da água potável

Cientistas descobrem interruptor oculto de queima de gordura que pode fortalecer os ossos

ARTIGOS RELACIONADOS Mais do autor