組み込みの AI を使ってみる

公開日: 2024 年 12 月 12 日、最終更新日: 2025 年 5 月 20 日

組み込みの AI API を使用すると、ウェブ アプリケーションは独自の AI モデルをデプロイまたは管理することなく、AI を活用したタスクを実行できます。

要件

Google は、ブラウザ間でこれらの API を標準化する取り組みを進めています。

モデル

Prompt API、Summarizer API、Writer API、Rewriter API は、パソコンやノートパソコンでローカルに実行するように設計された大規模言語モデルをダウンロードします。これらの API はモバイル デバイスでは動作しません。これらの API を使用する前に、Google の生成 AI の使用禁止に関するポリシーをご確認ください。

現時点では、Summarizer API、Writer API、Rewriter API はテキストからテキストへのモダリティのみをサポートしています。Prompt API にマルチモーダル機能が追加され、早期プレビュー プログラムの参加者はローカル プロトタイピングで利用できるようになりました。

ハードウェア

Chrome でこれらの API を使用して機能を操作するデベロッパーとユーザーには、次の要件があります。他のブラウザでは動作要件が異なる場合があります。

言語検出 API と翻訳 API は、パソコン版 Chrome で動作します。これらの API はモバイル デバイスでは動作しません。Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たす場合に Chrome で動作します。

  • オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Gemini Nano を使用する API は、Android 版 Chrome、iOS 版 Chrome、ChromeOS 版 Chrome ではまだサポートされていません。
  • ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上。
  • GPU: 4 GB を超える VRAM。
  • ネットワーク: 無制限のデータ通信または従量制でない接続。

Gemini Nano の正確なサイズは若干異なる場合があります。現在のサイズを確認するには、chrome://on-device-internals にアクセスして [モデルのステータス] に移動します。リストに表示された [ファイルパス] を開いて、モデルのサイズを確認します。

構築を開始

開発のさまざまな段階で、いくつかの組み込み AI API を利用できます。一部は Chrome 安定版で利用可能、一部はオリジン トライアルの参加者のみが利用可能、一部は早期プレビュー プログラムの参加者のみが利用可能です。

各 API には、ローカル プロトタイピングとオリジン トライアルを使用した本番環境の両方で、モデルの利用を開始してダウンロードするための独自の手順が用意されています。

これらの API はすべて、Chrome 拡張機能の構築時に使用できます。

localhost で API を使用する

これらの API はすべて Chrome の localhost で利用できます。

  1. chrome://flags/#prompt-api-for-gemini-nanoに向かいます。
  2. [有効] を選択します。
  3. [再起動] をクリックするか、Chrome を再起動します。

Gemini Nano がダウンロードされ、意図したとおりに動作することを確認するには、DevTools を開き、コンソールに await LanguageModel.availability(); と入力します。これにより、available が返されます。

localhost のトラブルシューティング

モデルが想定どおりに機能しない場合は、次の手順を行います。

  1. Chrome を再起動します。
  2. chrome://componentsに向かいます。
  3. Optimization Guide On Device Model が存在することを確認します。これは、Gemini Nano が利用可能であるか、ダウンロード中であることを意味します。
    • バージョン番号が表示されていない場合は、[更新を確認] をクリックしてダウンロードを強制します。
  4. DevTools を開き、コンソールに LanguageModel.availability(); と入力します。これにより、available が返されます。

必要に応じて、しばらく待ってから上記の手順を繰り返します。

標準プロセス

Google では、これらの API がすべてのブラウザで動作するように、標準化に取り組んでいます。つまり、Google はウェブ プラットフォーム コミュニティに API を提案し、さらなる議論のために W3C Web Incubator Community Group に移行しました。

各 API について、W3C、Mozilla、WebKit にフィードバックを求めています。

各 API のこのプロセスについて詳しくは、対応するドキュメントをご覧ください。

意見交換とフィードバックの提供

組み込み AI をお試しになり、フィードバックがございましたら、ぜひお聞かせください。