現時点で確認できている「Odyssey」に関するリーク情報のまとめ(非公式・噂としてご覧ください)
- エージェントモードのコードネームは「Odyssey」
OpenAIが開発中の新しいエージェントモードとして、内部では「Odyssey」の名称で呼ばれていると伝えられています。 - 仮想ブラウザによる自律操作
Odysseyは独自の仮想ブラウザを用いて、ユーザーに代わってWeb上のタスクを自動的に操作・実行できる機能を備えている模様です。 - 「Deep research」との連携
既存の高度リサーチ機能「Deep research」と統合され、マルチステップでの情報収集や分析をシームレスに実施するとされています。 - Google Driveなどファイル横断分析
Google Drive等に保存されたファイルを横断的に読み込み、内容を解析して詳細なレポートを生成可能とする機能が搭載されるとのことです。 - リアルタイムスクリーンショット表示
仮想ブラウザ上で行われる操作は、その都度スクリーンショットで可視化され、ユーザーが進行状況をリアルタイムで確認できるとされています。 - ユーザーによるいつでも介入・引き継ぎ
Odysseyの自律的な操作中でも、ユーザーはいつでも手動で処理を引き継ぎ、介入できる仕組みが用意されているようです。 - 中断セッションの再開
途中で中断したタスクを後から再開する機能も予定されており、長時間に渡る作業も途切れずに続行できます。 - エージェントタスクへのファイルアップロード対応
エージェント実行中にユーザーが新たなファイルをアップロードし、それをタスク処理に組み込むことが可能になるといいます。 - 発表は本日深夜2時(日本時間)予定のライブストリームにて
OpenAIは「ChatGPT 🤝 Deep research 🤝 Operator」という告知とともに、現地時間7月17日10:00 PT(日本時間7月18日2:00)からのライブ配信を予告しています。
正式な詳細はライブストリームでの発表を待つ必要がありますが、上記の機能が実現すれば、リサーチ・レポート作成からWeb操作の自動化まで、広範なタスクを高度にサポートするエージェントとして大きな注目を集めそうです。
1. 公式機能で確認済みのコア能力
1-1. マルチステップWeb調査で構造化レポートを生成(Deep Research)
ユーザーが課題や質問を与えると、エージェントが数百のオンラインソース(テキスト・画像・PDF等を含む)を探索し、分析・統合して研究アナリスト級の包括レポートを作成。処理時間はタスクにより5〜30分程度かかる重めの非同期ジョブ。Pro層先行(当初)で順次拡大予定とされる。精度は高まったが最新性判断や誤推論リスクが残るため人間による確認推奨。
1-2. ブラウザ操作による実行代行(Operator / Computer‑Using Agent)
フォーム入力、オンライン注文、予約、リストに基づく買い物など、ブラウザ上で人間と同等のクリック&タイプ操作を実行可能な研究プレビュー。ユーザーはいつでも「Takeover(引き継ぎ)」で制御を奪回でき、支払い等のセンシティブ操作前に確認を求める安全設計。基盤モデルはGUI要素を視覚で認識し操作するComputer‑Using Agent(CUA)。
1-3. Web検索 / ファイル検索 / コンピュータ操作ツールを単一APIで統合(Responses API + Agentsツール群)
Responses APIではWeb検索、ファイル検索(複数ファイル型・メタデータフィルタ対応)、コンピュータ操作(ブラウザ環境で画面操作キャプチャ)などのビルトインツールを組み合わせ、マルチステップのエージェントワークフローを構築可能。開発者は観測ツールでトレースしながらエージェント挙動を可視化できる。
2. 公式機能を組み合わせた「できること」(応用想定)
以下は現行機能(Deep Research + Operator + Responses APIツール群)を組み合わせた場合に、比較的低リスクで構築できるワークフロー例。
2-1. 「市場・競合調査レポート→行動」一気通貫
- Deep Researchで市場規模・競合製品・価格帯を収集。
- レポート結果を要約し条件抽出。
- Operatorが指定ECサイトを開き、条件に合う商品をカートに入れる/フォームに貼り付ける。
- 決済前にユーザーTakeoverで確認。
Deep ResearchとOperatorの組合せでより高度なタスク連鎖をOpenAI側も将来的方向性として言及。
2-2. クラウド文書横断→要約教材生成(Driveエクスポート前提)
ローカル/アップロード済ファイルをFile Searchに投入(必要に応じてDrive等から手動エクスポート)→Deep Researchで外部情報と統合→OperatorがLMSやブログCMSにドラフト投稿。教育・サポート文書向けFile Search活用例がOpenAIから紹介されており、組織ナレッジベース統合は実装余地大。
2-3. 高関与購買(車・家電等)の比較表自動作成
Deep Researchに比較要件(価格帯・スペック・評判)を渡し、数十〜数百ソースを収集し表形式に整理。必要ならOperatorがメーカー/販売店サイトで在庫・キャンペーン確認。Deep Researchは高額購買の比較調査支援を想定ユースとして公式が挙げている。
2-4. 定期レポーティング & ウォッチ
Responses API経由で定期スケジュール起動(外部オーケストレーション)→Web検索で最新記事取得→File Searchで社内資料差分チェック→短報生成。Agent構築向けビルトインツールと観測機能が提供されているため自動レポート基盤が組める。
2-5. 手作業の多い業務プロセス(データ入力・QA検証)半自動化
コンピュータ操作ツール(CUA)でレガシーWeb UIにログイン→データ転記→スクリーンキャプチャ記録。RPA代替・補完として事例(Unify, Luminai等)紹介済。
3. リーク / 未確認機能「Odyssey」で強化されると噂されるポイント
以下はライブストリーム前の報道・SNS発信ベース。実際の提供範囲・UI・料金は発表で要確認。
3-1. Deep Research + Operatorを統合した「Agent Mode(Odyssey)」フロント
OpenAIが「ChatGPT 🤝 Deep research 🤝 Operator」とライブ案内したこと、主要テックメディアのライブブログで「Odyssey」名のエージェント統合UIがデモされるとの噂が拡散。
3-2. クラウドストレージ(Google Drive等)コネクタでファイル横断分析
複数報道がDrive等クラウドを直接クロールしてレポート生成できる統合を示唆(AIBase、Teknotum、Tom’s Guideライブ更新)。なおOpenAI公式のFile Searchツールは複数ファイル型・ベクタストア検索をサポートしており、基盤的には外部コネクタ拡張が考えられる。
3-3. リアルタイム仮想ブラウザ画面(スクリーンショット / ストリーミング)表示
リーク投稿に、エージェントのブラウザ操作を逐次スクリーンショットで可視化するUIが含まれるとの指摘。コンピュータ操作ツールは画面キャプチャを取り扱う設計であるため、フロント統合は技術的に整合的。
3-4. ユーザー即時介入(Takeover)ボタン常設
Operator研究プレビューで導入済のTakeover概念がOdyssey UIに継承され、ユーザーが任意タイミングで操作を奪い返せるとするリーク。
3-5. セッション中断→再開(タスクセーブ)
長時間リサーチや操作を一時停止し後で再開できるセッション管理機構が示唆されている(Tom’s Guideライブ更新等)。正式実装は未確認。
3-6. タスク中の追加ファイルアップロード & コンテキスト提案
進行中エージェントにファイルを後付け投入し再解析、またはエージェントから「もっと精度を上げるためこの情報を追加してください」といったプロンプト支援を行うUI要素がリークで言及。
実践ブートキャンプ実施中

誰も教えてくれない生成AIを戦略的に活用するための実践ブートキャンプ実施中。
すでに30名以上が参加。
「行動できる人」になって、人生を変えよう。
詳細は↓↓↓