概要
MicrosoftのBingチームは2026年4月、埋め込みモデル「Harrier」をMITライセンスのオープンソースとしてHugging Face上で公開した。Harrierは多言語MTEB-v2ベンチマークで総合スコア74.3を記録し首位を獲得、OpenAIやAmazonが提供するプロプライエタリな埋め込みモデルを上回る性能を示している。商用・非商用を問わず無償で利用可能なMITライセンスのもと提供されており、エンタープライズ用途から個人開発まで幅広い活用が期待される。
モデルの技術的詳細
Harrierは3つのサイズ展開で提供される。フルサイズの270億パラメータモデルに加え、より軽量な6億パラメータ版と2億7000万パラメータ版が用意されており、利用するハードウェアのスペックに応じて選択できる。94の言語に対応し、3万2768トークンのコンテキストウィンドウと5376次元の埋め込みベクトルを持つ。学習データは20億件以上の実例に加え、GPT-5を用いて生成した合成データも活用されている。
活用シナリオと今後の展開
埋め込みモデルはAIシステムが情報を検索・取得・整理し、正確な応答を生成するための基盤となる技術であり、RAG(Retrieval-Augmented Generation)などの構成において中核的な役割を担う。MicrosoftはHarrierをBing検索へ統合するとともに、複雑なマルチステップタスクを処理するAIエージェント向けのグラウンディングサービスにも組み込む計画を明らかにしている。高性能かつオープンなモデルの公開により、開発者コミュニティが自前のRAGパイプラインや検索システムを構築する際のベースラインが大きく引き上げられることになる。