Início Ciência e tecnologia Caçador de Dipfeck do Google, você vê o que não pode fazer...

Caçador de Dipfeck do Google, você vê o que não pode fazer – mesmo em vídeo sem boca

14
0

Em uma época em que vídeos manipulados podem espalhar o caos, os agressores podem causar danos aos seres humanos e danificar, os pesquisadores da UC Riverside criaram um novo sistema poderoso para publicar essas duplicatas.

Amit Roy-Choduri, professor de engenharia elétrica e de computadores, e Marlan da UCR e da Rosemary Bornes College of Engineering, ambos o candidato de doutorado Rohit Kundu detectaram adulteração de vídeos, com cientistas do Google para desenvolver um modelo de inteligência artificial. (Roy-Chaudhuri Ucr Riverside Artificial Intelligence Research and Education Institute Vice-Diretor do Instituto, um novo Centro de Pesquisa Inter-Disciplinar da UCR.)

A rede universal conhecida como Rede Universal de Vídeos Típeros e Sintéticos (ITE) detecta fraude, verificando não apenas as faces, mas todo o quadro de vídeo, incluindo padrões de fundo e velocidade. Essa análise o torna uma das primeiras ferramentas capazes de detectar vídeos sintéticos ou médicos que não dependem do conteúdo facial.

“Deepfkes se desenvolveu”, disse Kundu. “Eles não são mais apenas o rosto da boca, as pessoas agora estão fazendo vídeos falsos completamente – do fundo ao fundo – usando modelos de geradores fortes. Nosso sistema é construído para pegar tudo”.

O desenvolvimento da unidade ocorre porque a geração Text-Video e Image-Video se tornou amplamente disponível online. Essas plataformas de IA podem praticamente permitir que qualquer pessoa fabrique o vídeo do INC, criando riscos sérios para indivíduos, instituições e democracia.

Kundu disse: “Quanto essas ferramentas se tornaram acessíveis é assustador”. “Qualquer pessoa com habilidades moderadas pode ignorar os filtros de proteção e fazer um vídeo realista da personalidade pública que nunca disse”.

Kundu explicou que os detectores de Dipfek anteriores se concentraram nos sinais de face quase completamente.

“Se não houver rosto no quadro, muitos detectores não funcionam apenas”, disse ele. “No entanto, o caos pode vir de diferentes formas. Mudar o fundo de uma cena pode facilmente distorcer a verdade”.

Para abordá-lo, a unidade usa um modelo de educação profunda baseada em transformadores para analisar videoclipes. Ele detecta inconsistências espaciais e temporárias sutis – sinais perdidos frequentemente por sistemas anteriores. O modelo se baseia em uma estrutura de IA fundamental conhecida como Siglip, que extrai os recursos que não estão vinculados a uma determinada pessoa ou objeto. Um método de treinamento sofisticado chamado “assistência de atenção” pede ao sistema que monitore várias zonas visuais em cada quadro, impedindo que ele se concentre apenas no rosto.

O resultado é um detector universal produzido sem imagens reais em vídeos sintéticos complexos e completos.

“Este é um modelo que gerencia todas essas situações”, disse Kundu. “É isso que o torna público.”

Os pesquisadores apresentaram suas explorações na conferência 2025 de alta classificação relacionada à visão computacional e ao reconhecimento de padrões (CVPR) em Ten. Os co-autores incluem o pesquisador do Google Howon Gionag, o enorme Mohanti e o Athula Balachandra. A IEEE Computer Society e a Computer Vision Foundation, o CVPR é um dos locais de publicação científica mais influentes do mundo.

Cooperação com o Google, onde o Kundu International, o modelo forneceu acesso a conjuntos de dados amplos e recursos de computação necessários para treinar o modelo em uma ampla gama de vídeos, incluindo textos ou imagens fixas geradas a partir dos formatos de texto que geralmente carimbam os detectores existentes.

Embora ainda esteja no desenvolvimento, a unidade pode em breve desempenhar um papel importante na defesa do caos em vídeo. Possíveis usuários gerenciam plataformas de mídia social, verificadores de fatores e redações que trabalham para evitar vídeos manipulados virais.

Kundu disse: “As pessoas merecem saber se o que vêem é real”. “E o fato de a IA ser melhor em duplicar a realidade é que precisamos ser melhores para revelar a verdade”.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui