ChatGPT プラグインとは何ですか、またどのように機能しますか
ChatGPT は、一般公開されて以来、過去数か月で世界中を席巻しました。実際、まだ数か月しか経っていないのですか?そのインパクトはまるで何年も前から存在しているかのように感じさせます。
しかし、そのすべての長所にもかかわらず、それほど小さいわけではない小さな欠陥が 1 つありました。最近の情報にはアクセスできませんでした。2021年半ばまでの情報しかなかった。しかし、OpenAI がついにその状況を変え始めています。いいえ、新しいデータでトレーニングされていません。ただし、OpenAI はついに、インターネットおよび一部のサードパーティ サービスへの接続を可能にする ChatGPT プラグインの早期サポートを実装しました。
ChatGPT プラグインとは何ですか?
プラグインは、言語モデル専用に設計されたツールです。これらによりチャットボットの機能が強化され、以前は不可能だったタスクを実行できるようになります。たとえば、スポーツのスコアや株価などのリアルタイム情報を取得したり、航空券の予約などのユーザーに代わってアクションを実行したり、会社の文書などのナレッジベース情報を取得したりできるようになりました。
ChatGPT のリリース以来、プラグインはユーザーから最も要望の高いアイテムでしたが、OpenAI がついにそれを実現しました。ただし、それらのリリースは段階的に、反復的に展開される予定です。当初、OpenAI はいくつかのサードパーティ プラグインといくつかの独自のプラグインのみをリリースしました。
ユーザーとプラグインを構築したい開発者のアクセスも現在制限されています。さらに、エンド ユーザーとしてのアクセスは、現時点では ChatGPT Plus ユーザーにのみ許可されていますが、ChatGPT は、将来的には展開を拡大する予定であると述べています。
アクセスは待機リストに参加した後にのみリクエストできます。そのためには、アクセスを希望する理由とフィードバックを提供する意思があるかどうかについての小さなアンケートに記入する必要があります。
サードパーティのプラグインのリストには次のものが含まれます。
- Expedia – このプラグインを使用すると、ホテルや航空券などの空室状況や価格に関する完全な情報を利用して、ChatGPT で次の旅行を計画できます。
- FiscalNote – この ChatGPT プラグインを使用すると、リアルタイムの法律、政治、規制の情報とデータにアクセスできるようになります。
- Instacart – ChatGPT を使用して、近くの食料品店やスーパーマーケットに食料品を注文します。
- KAYAK – ChatGPT 内で KAYAK を使用して、定義された予算内で車、ホテル、レンタルなどを検索します。
- Klarna Shopping – ChatGPT の会話内でさまざまなオンライン ショップの価格を検索および比較します。
- Milo Family AI – 親が子育てを強化するためのプラグイン。
- OpenTable – チャットでレストランのおすすめや予約リンクを取得します。
- Shopify から購入– さまざまなブランドの製品を検索します。
- Slack – Slack で ChatGPT を使用してコミュニケーションを合理化します
- 話す– AI を活用した語学講師を雇いましょう
- Wolfram – ChatGPT を入手して計算や数学の知識などにアクセスします。
- Zapier – このプラグインを使用して、ChatGPT 内で 5000 を超えるアプリと対話します。
OpenAI 自体からも 2 つのプラグインがあります。ブラウジング (Web ブラウザ) とコード インタープリタ、および Retriever と呼ばれるオープンソース プラグインです。現在、すべてのプラグインはアルファ版テスト段階にあります。
これらのプラグインはどのように機能するのでしょうか?
OpenAI によると、プラグインは ChatGPT のような言語モデルにとって「目であり耳」です。言語モデルに関する事実は、言語モデルはトレーニング データからしか学習できず、学習には限界があるということです。ChatGPT 自体はテキストベースの指示しか提供できません。これらのプラグインを使用すると、これらの指示に従うだけでなく、最新すぎたり、個人的すぎたり、具体的すぎてトレーニング データに含めることができなかった情報を利用できるようにすることもできます。
しかし、AI モデルが指示に従い、ユーザーに代わってアクションを実行することを考えると、安全性の懸念が生じます。それが、プラグインの展開が遅い理由です。OpenAI は安全性を中核原則としてそれらを構築しており、実際の使用状況を監視する予定です。
これらのプラグイン モデルのいくつかがどのように機能するかを見てみましょう。
ブラウジング
これは ChatGPT をインターネットに接続するプラグインで、OpenAI 自体の 2 つのプラグインのうちの 1 つです。このプラグインは、それほど奇妙な出来事ではなく、Microsoft の Bing 検索 API を使用します。両社は何年も前から取引を行ってきた。初期投資とは別に、Microsoft は現在、新しい Bing AI を強化するために OpenAI テクノロジーも使用しています。
このモデルは、インターネットの閲覧方法を知っているだけでなく、いつインターネットを閲覧すべきか、いつ閲覧すべきではないかも知っています。たとえば、ユーザーが ChatGPT にオスカー 2023 に関する情報を要求すると、インターネットでクエリを正確に検索します。しかし、史上初めて開催されたオスカーについて尋ねられた場合、その情報はトレーニング データの一部であるため、インターネットを検索しません。
したがって、ChatGPT にインターネットを参照させるには、「参照」モデル/プラグインを選択する必要があります。
現在は、ユーザーがインターネットの閲覧を要求するプロンプトを入力すると、インターネットの閲覧を実行します。ボット自体が情報を認識するのに時間がかかるため、このプロセスには時間がかかります。「Web の閲覧…」タイルを展開すると、ChatGPT が応答を生成するまでの動作の流れを確認できます。
そこでは、どのようなクエリが検索されたか、どのリンクがクリックされたか、いつリアルタイムで読み取られているかがわかります。テキストベースの Web ブラウザを使用するため、検索結果を超えて実際に Web サイトを読んで移動できます。
ChatGPT がイベントを把握すると、以前と同様に自然言語モデルで答えが得られます。ただし、閲覧モデルで生成される場合、答えには引用が含まれます。引用をクリックするとウェブサイトに移動します。この点は Bing Chat AI と同じです。
安全性の観点から、テキストベースのブラウザは GET リクエストのみを行うことができるため、特定のリスクが軽減されます。たとえば、このモデルはインターネットから情報を取得することしかできませんが、フォームの送信などの「トランザクション」操作を実行することはできません。
コードインタープリタ
OpenAI の 2 番目のプラグインであるコード インタープリター モデルは、ChatGPT に Python インタープリターを提供します。また、短期間のディスク領域も提供します。
単一のチャット中はセッションがアクティブであるため、次の通話は前の通話の上に構築できますが、時間の上限があります。さらに、コード インタープリターは、ファイルのアップロードと結果を含むファイルのダウンロードもサポートしています。
安全に保つために、OpenAI はそれをサンドボックス化されたファイアウォールで囲まれた実行環境に保管しています。コード インタープリターのインターネット アクセスも無効になります。OpenAI によれば、この動きはモデルの機能を制限しますが、当初はそれが正しい動きであると感じています。
会話を開始する前に、「コード インタープリター」モデルを選択する必要があります。
ユーザーがコード インタープリター プラグインの使用を必要とするプロンプトを入力すると、ChatGPT はコード インタープリター プラグインを使用して必要な計算を実行し始めます。ブラウズと同様に、ユーザーは「作業を表示」をクリックすることで ChatGPT の計算フローを確認でき、計算のすべてのステップが表示されます。
OpenAI は初期テストで、このプラグインが特定のシナリオで役立つことを発見しました。これらには次のものが含まれます。
- 定量的および定性的な数学的問題を解決することですが、率直に言って、ユーザーは以前は ChatGPT がゴミであると感じていました。
- 多くのユーザーが興奮しているデータ分析と視覚化を行います。
- 形式間でのファイルの変換
OpenAI は、ユーザーがコード インタープリターを試してみると、コード インタープリターで実行できるより便利なタスクを発見できることを期待しています。
サードパーティのプラグイン
残りのプラグインはプラグイン モデルに分類されます。これには、開発者が使用できる OpenAI のオープンソース Retriever プラグインと 12 個のサードパーティ プラグインも含まれます。
ドロップダウンからプラグイン モデルを選択すると、ユーザーはストアから必要なプラグインをインストールできます。
プラグインがどのように機能するかを簡単に説明すると、次のようになります。
ユーザーがプラグインをインストールして有効化し (自動的に有効化されるわけではありません)、会話を開始すると、OpenAI はプラグインの簡潔な説明をメッセージ内の ChatGPT に挿入します。このメッセージはエンド ユーザーには表示されませんが、プラグインの説明、エンドポイント、例が含まれます。したがって、会話でプラグインの使用を選択するまで、ChatGPT はそれに関する情報を持ちません。すべての会話で使用するプラグインを有効にする必要があります。
これで、クエリを ChatGPT に入力できるようになりました。ボットは、プラグインの呼び出しが適切であると判断した場合、API 呼び出しを使用して実行します。言い換えれば、プラグインを呼び出す必要があるかどうかを自分自身で決定できます。
その後、プラグインから取得した結果が、生成される応答に含まれます。
以下は、ChatGPT が OpenTable、Wolfram、Instacart のプラグインをどのように使用するかの例です。ユーザーは ChatGPT に、土曜日にはビーガン レストランを、日曜日にはビーガン レシピを勧めるように依頼しました。また、Wolframを使用して推奨するレシピのカロリーを計算したり、Instacartからレシピの材料を注文したりするよう依頼します。AI ボットはまさにそれを行います。
まず、OpenTable を使用してレストランを推奨し、予約するためのリンクを提供します。
ビーガンレシピを推奨し(以前は可能でした)、Wolframを使用してレシピのカロリーを計算します。
最後に、必要な材料をすべて Instacart のカートに追加し、ユーザーがクリックするだけで注文を完了できるリンクが表示されます。
プラグインは ChatGPT の動作方法を完全に変えようとしています。ここ数か月の AI の進歩の速さにより、今は生きるのが恐ろしいと同時に素晴らしい時代になっていますね。
コメントを残す