
arXiv aplicará banimento de 1 ano para referências falsas
Especialista em LLMs, AI Agents e Infraestrutura de IA

Especialista em LLMs, AI Agents e Infraestrutura de IA
O arXiv adotou uma nova política que bane autores por um ano caso incluam referências falsas em suas submissões, buscando proteger a integridade acadêmica. A medida responde ao aumento de 30% nas submissões com conteúdo gerado por IA em 2024, muitas contendo 'citações alucinadas'.
O arXiv, um dos maiores repositórios de pré-publicações científicas do mundo, anunciou a implementação de uma nova política rigorosa para combater a disseminação de referências falsas em artigos submetidos à plataforma. A partir de agora, autores que incluírem citações inventadas ou irreais, frequentemente geradas por Inteligência Artificial (IA), poderão ser banidos por 1 ano. Após o período de suspensão, esses pesquisadores precisarão comprovar que seus futuros trabalhos foram aceitos em revistas científicas ou conferências respeitadas antes de serem reconsiderados para publicação no arXiv.
A decisão ocorre em resposta ao aumento da utilização de Modelos de Linguagem de Grande Escala (LLMs, na sigla em inglês) na redação de trabalhos acadêmicos. Segundo o arXiv, houve um aumento de 30% em submissões contendo conteúdos gerados por IA em 2024, muitas das quais apresentavam referências falsas.
Citações falsas, conhecidas como "hallucinated citations" no jargão técnico, são referências que não correspondem a trabalhos reais ou que citam fontes inexistentes. Esse problema tem se tornado mais comum com a popularização de ferramentas de IA como o ChatGPT para a criação de conteúdos acadêmicos.
De acordo com uma análise publicada pela Nature, essas referências não verificáveis têm contribuído para a disseminação de desinformação científica e causado confusão, mesmo em conferências de prestígio. Além disso, erros desse tipo podem comprometer a credibilidade da ciência como um todo, destacando a necessidade de políticas como a recém-implementada pelo arXiv.
A política do arXiv estabelece os seguintes pontos principais:
Essa medida visa não apenas proteger a credibilidade da plataforma, mas também combater o chamado "spam acadêmico", um fenômeno que tem crescido com o uso de ferramentas automatizadas para gerar textos científicos.
Espera-se que a nova política beneficie a comunidade científica ao exigir maior rigor na verificação de fontes pelos autores. Isso pode reduzir a prevalência de trabalhos contendo dados incorretos e, consequentemente, aumentar a qualidade e a confiabilidade da literatura acadêmica disponível.
Por outro lado, a política pode trazer desafios, especialmente para pesquisadores em início de carreira ou vinculados a instituições com recursos limitados. A exigência de validação prévia por revistas e conferências renomadas pode criar barreiras adicionais para a publicação e disseminação de suas pesquisas, retardando o progresso acadêmico em algumas áreas.
A política do arXiv marcará um ponto de inflexão na luta contra conteúdo acadêmico de baixa qualidade? Alguns pontos de atenção incluem:
Empresas que desenvolvem LLMs, como OpenAI e Google, poderão enfrentar maior pressão para aprimorar seus modelos, reduzindo a geração de informações incorretas. Isso pode levar a investimentos mais altos em pesquisa e desenvolvimento, ao mesmo tempo em que aumenta a demanda por ferramentas de validação e revisão automática no mercado acadêmico.
São referências que apontam para fontes que não existem ou que não correspondem aos trabalhos citados, muitas vezes geradas por modelos de IA como LLMs.
Submissões com referências falsas serão rejeitadas, e os autores responsáveis serão banidos por 1 ano. Após esse período, novos trabalhos precisarão ser previamente aceitos por revistas ou conferências reconhecidas.
Pesquisadores em início de carreira podem enfrentar dificuldades maiores para publicar, devido à exigência de validação prévia por revistas ou conferências renomadas.
💡 Dica Pro: Ferramentas como o Zotero e o EndNote podem ser integradas a fluxos de trabalho para verificar automaticamente a existência e a exatidão das referências citadas em artigos acadêmicos antes da submissão.