arXivがAI生成の未検証論文に1年間の投稿禁止措置、幻覚引用が2年で約10倍に急増

概要

世界最大の学術プレプリントサーバーarXivは、AIが生成した未検証のコンテンツを含む論文を提出した著者に対し、1年間の投稿禁止措置を導入すると発表した。同サーバーのコンピュータサイエンス部門議長であるThomas Dietterichが公表したこのポリシーは、LLM（大規模言語モデル）の急速な普及に伴い、科学的な誠実性が損なわれることへの危機感から生まれた施策だ。「著者がLLMの生成結果を検証しなかったという確実な証拠がある場合、その論文のいかなる内容も信頼できない」とDietterichは述べている。

禁止対象となる行為

このポリシーが対象とするのは、AI利用そのものではなく、AIの出力を無検証で論文に組み込む「不注意な」行為だ。禁止処分の根拠となる「確実な証拠」として挙げられているのは、以下のような明白な違反例である。

実在しない論文への幻覚引用（ハルシネーション）
「ここに200単語の要約があります。変更をご希望ですか？」といったチャットボットのレスポンスがそのまま残っている
「実験の実数を入力してください」などの未削除のプレースホルダーテキスト

処分を受けた著者は1年間arXivへの投稿が禁止され、その後も投稿を再開するには査読済みの学術誌での掲載受理が条件となる。不適切な言語、盗用コンテンツ、誤情報なども著者の責任として扱われる。

幻覚引用の急増が背景に

このポリシー導入の背景として挙げられているのが、学術論文全般における幻覚引用の急増だ。コロンビア大学看護学部の研究チームがPubMed Central上の生物医学論文250万本・参考文献1億2,600万件を監査した結果（『The Lancet』2026年5月号掲載）、2023年には約2,828本に1本の割合だった偽造引用は、2025年には458本に1本、2026年初頭には277本に1本にまで悪化していた。わずか2〜3年で約10倍という急増ペースは、AI執筆支援ツールの普及と強く相関しているとされる。生物医学分野で先行して顕在化したこの問題は、LLMの利用が広がるarXivが扱うコンピュータサイエンスなど他分野でも同様の懸念が指摘されている。

政策の限界と今後の課題

一方で、このポリシーが捕捉できるのはあくまでも「最も不注意な違反行為」に限られる。巧妙に生成された科学的に中身のない主張や、文脈上自然に見える誤情報は、自動的なチェックでは検出が難しく、引き続き査読や研究機関による監督が必要となる。arXivはプレプリントサーバーであり査読を行わないため、コミュニティ全体での規律ある運用が求められる。研究者に対しAIツール利用への全面的な責任を明示したこの措置は、学術出版におけるAIガバナンスの議論に一石を投じるものとして注目されている。

概要#

禁止対象となる行為#

幻覚引用の急増が背景に#

政策の限界と今後の課題#

概要

禁止対象となる行為

幻覚引用の急増が背景に

政策の限界と今後の課題