公開日: 2024 年 12 月 12 日、最終更新日: 2025 年 5 月 20 日
組み込みの AI API を使用すると、ウェブ アプリケーションは独自の AI モデルをデプロイまたは管理することなく、AI を活用したタスクを実行できます。
要件
Google は、ブラウザ間でこれらの API を標準化する取り組みを進めています。
モデル
Prompt API、Summarizer API、Writer API、Rewriter API は、パソコンやノートパソコンでローカルに実行するように設計された大規模言語モデルをダウンロードします。これらの API はモバイル デバイスでは動作しません。これらの API を使用する前に、Google の生成 AI の使用禁止に関するポリシーをご確認ください。
現時点では、Summarizer API、Writer API、Rewriter API はテキストからテキストへのモダリティのみをサポートしています。Prompt API にマルチモーダル機能が追加され、早期プレビュー プログラムの参加者はローカル プロトタイピングで利用できるようになりました。
ハードウェア
Chrome でこれらの API を使用して機能を操作するデベロッパーとユーザーには、次の要件があります。他のブラウザでは動作要件が異なる場合があります。
言語検出 API と翻訳 API は、パソコン版 Chrome で動作します。これらの API はモバイル デバイスでは動作しません。Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たす場合に Chrome で動作します。
- オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Gemini Nano を使用する API は、Android 版 Chrome、iOS 版 Chrome、ChromeOS 版 Chrome ではまだサポートされていません。
- ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上。
- GPU: 4 GB を超える VRAM。
- ネットワーク: 無制限のデータ通信または従量制でない接続。
Gemini Nano の正確なサイズは若干異なる場合があります。現在のサイズを確認するには、chrome://on-device-internals
にアクセスして [モデルのステータス] に移動します。リストに表示された [ファイルパス] を開いて、モデルのサイズを確認します。
構築を開始
開発のさまざまな段階で、いくつかの組み込み AI API を利用できます。一部は Chrome 安定版で利用可能、一部はオリジン トライアルの参加者のみが利用可能、一部は早期プレビュー プログラムの参加者のみが利用可能です。
各 API には、ローカル プロトタイピングとオリジン トライアルを使用した本番環境の両方で、モデルの利用を開始してダウンロードするための独自の手順が用意されています。
- Translator API
- Language Detector API
- Summarizer API
- Prompt API
- Chrome 拡張機能の Prompt API には、拡張機能デベロッパーが Prompt API を使用してビルドするのに役立つ具体的な手順が記載されています。
- Writer API と Rewriter API
- Chrome 拡張機能で使用する Prompt API
- ウェブ用プロンプト API(EPP のみ)
これらの API はすべて、Chrome 拡張機能の構築時に使用できます。
localhost で API を使用する
これらの API はすべて Chrome の localhost
で利用できます。
chrome://flags/#prompt-api-for-gemini-nano
に向かいます。- [有効] を選択します。
- [再起動] をクリックするか、Chrome を再起動します。
Gemini Nano がダウンロードされ、意図したとおりに動作することを確認するには、DevTools を開き、コンソールに await LanguageModel.availability();
と入力します。これにより、available
が返されます。
localhost のトラブルシューティング
モデルが想定どおりに機能しない場合は、次の手順を行います。
- Chrome を再起動します。
chrome://components
に向かいます。- Optimization Guide On Device Model が存在することを確認します。これは、Gemini Nano が利用可能であるか、ダウンロード中であることを意味します。
- バージョン番号が表示されていない場合は、[更新を確認] をクリックしてダウンロードを強制します。
- DevTools を開き、コンソールに
LanguageModel.availability();
と入力します。これにより、available
が返されます。
必要に応じて、しばらく待ってから上記の手順を繰り返します。
標準プロセス
Google では、これらの API がすべてのブラウザで動作するように、標準化に取り組んでいます。つまり、Google はウェブ プラットフォーム コミュニティに API を提案し、さらなる議論のために W3C Web Incubator Community Group に移行しました。
各 API について、W3C、Mozilla、WebKit にフィードバックを求めています。
各 API のこのプロセスについて詳しくは、対応するドキュメントをご覧ください。
意見交換とフィードバックの提供
組み込み AI をお試しになり、フィードバックがございましたら、ぜひお聞かせください。
- 組み込み AI API をすべて確認する。
- 早期プレビュー プログラムに参加して、新しい API をいち早く確認し、メーリング リストにアクセスしましょう。
- Chrome の実装についてフィードバックがある場合は、Chromium のバグを報告してください。
- ウェブ標準について学習します。