Metaは今週、Brain2Qwerty v2を発表した。これはヘルメット型MEG(脳磁図)スキャナーで神経活動を記録し、エンドツーエンドの深層学習モデルで直接対象テキストをデコードする非侵襲型ブレイン・コンピュータ・インターフェース(BCI)システムであり、平均単語精度は61%に達する。Metaは同時に、Digital Brain Projectの一環としてコードとデータセットをオープンソース化し、500万ドルのファンドを設立した。
Brain2Qwerty v2の技術アーキテクチャ:トレーニング規模とエンドツーエンドのデコード手法
本システムはエンドツーエンドの深層学習モデルを採用し、生のMEG脳信号から直接出力テキストをデコードする。手作業による中間処理ステップには依存せず、後段では大規模言語モデルが意味的文脈に基づいてノイズによる誤りを修正する。
トレーニングデータ規模:約22,000文、9名の被験者、各被験者あたり約10時間の録音データ。Metaは、トレーニングデータ量の増加に伴い精度が継続的に向上すると述べている。技術的な比較として、v1バージョンのMEG条件下での文字誤り率(CER)は約32%であり、同タスクをEEG(脳波図)に切り替えると約67%に上昇する。
MEGの技術的優位性と現有装置の制限
MEGは超伝導センサーを用いてニューロン活動時に生じる極めて微弱な磁場を検出する。磁場の透過性はEEGよりも優れており、信号は比較的明瞭である。しかし、MEGヘルメットの製造コストは数百万ドルに上り、外部磁場を遮断する特殊環境が必要であるため、長らく神経科学研究室に限られ、臨床や消費者向けアプリケーションには至っていない。
Brain2Qwerty v2は、こうした装置制約のもとで61%の精度を達成し、これまでは埋め込み型インターフェース(例:Neuralink)のみで可能だった水準に迫っている。Metaが非侵襲的アプローチを選択した根拠は、埋め込み型インターフェースの手術ハードルが多くの潜在的利益を得られる人々にとって受け入れがたいためである。
Metaのオープンソース計画:Digital Brain Projectと500万ドルのファンド
MetaはBrain2Qwerty v2の発表と同時に、Digital Brain Projectの一環としてシステムコードとトレーニングデータセットを公開した。また、500万ドルのファンドを別途設立し、オープンな神経科学データセットの構築を支援する専用資金とする。
Metaは、非侵襲型BCI研究のボトルネックの一つは公開された大規模な神経データセットの不足であると指摘する。現在、各研究機関が基礎データを重複して収集しており、その効率は極めて低い。本ファンドはコミュニティが共通のベンチマークデータを構築するための推進力を提供することを目的とする。
よくある質問
非侵襲型と埋め込み型ブレイン・コンピュータ・インターフェースの核心的な技術差は何か?
埋め込み型インターフェース(例:Neuralink)は脳皮質に直接電極を埋め込み、信号はクリーンで遅延が低く精度が高いが、外科手術が必要である。非侵襲的手法の主な課題は信号対雑音比である。頭蓋骨と頭皮が信号を大幅に減衰させ、EEGでは特に顕著である。MEGは透過性が比較的良好だが、機器のコストと環境要件が普及を制限している。
Brain2Qwerty v2の「エンドツーエンド」モデルはどのような技術的意義を持つか?
エンドツーエンドモデルは、生のMEG信号から直接出力テキストをデコードするため、研究者が手作業で中間ステップ(例:特定の脳波イベントを識別してから文字を段階的に導き出す)を設計する必要がない。Metaは研究開発過程でAIエージェントを用いてデコードプロセスの最適化余地を体系的に探索し、エンジニアが最終的なトレーニング構成を選定した。
本システムはいつ臨床または商業市場に登場する可能性があるか?
Brain2Qwerty v2は現在、実験室のMEG装置条件下でテストされており、研究段階のシステムであり、臨床試験や商業化には至っていない。Metaは精度にはまだ改善の余地があると述べているが、臨床または商業化のスケジュールは本報道時点では未発表である。