概要
OpenAIは2026年4月22日、テキスト中の個人識別情報(PII)を自動的に検出・マスキングするオープンウェイトモデル「Privacy Filter」を発表した。Apache 2.0ライセンスのもとHugging FaceおよびGitHubで公開されており、企業がAIワークフローにおけるプライバシーリスクを軽減するための実用的なツールとして設計されている。背景には、ユーザーが氏名・住所・口座番号などの機密情報を含むテキストをそのままAIツールに貼り付けてしまうという、広く見られる問題意識がある。OpenAIは「より回復力のあるソフトウェアエコシステムをサポートする」という目標のもと本モデルを開発したと説明している。
技術仕様とパフォーマンス
Privacy Filterはトークン分類アプローチを採用し、単一パスでテキストをラベル付けする設計になっている。総パラメータ数は15億(1.5B)だが、実稼働時に実際に使用されるのは約5,000万パラメータのみという効率的な構造を持つ。コンテキストウィンドウは最大128,000トークンに対応しており、長文書の処理にも適している。
対応するPIIカテゴリーは8種類で、名前・住所・メールアドレス・電話番号・URL・日付・口座番号・秘密情報を識別できる。公開ベンチマーク「PII-Masking-300k」では精度94.04%・再現率98.04%・F1スコア96%を達成し、改訂版データセットではF1スコアが97.43%に達するなど高い性能を示している。
ローカル実行によるプライバシー保護
本モデルの大きな特長のひとつが、オンデバイスでの完全ローカル実行だ。テキストデータを外部サーバーに送信することなくPIIの除去が可能なため、企業や組織が機密性の高いデータを扱う場合でも安心して利用できる。特に医療・金融・法務分野では規制上の要件としてデータの外部送信が制限されることが多く、ローカル処理対応は実務上の重要な優位点となる。
制限事項と活用上の注意
OpenAI自身も、本モデルには一定の限界があることを認めている。稀なPII識別子は見落とす可能性があり、文脈が限定的なテキストでは過剰なマスキングや検出漏れが発生することがある。そのため、法務・医療・金融分野での利用においては人的レビューを組み合わせることが推奨されている。あくまでもAIワークフローの第一層の防御として活用し、完全な代替手段として過信しないことが重要だ。