GUI登場以来のUI変更? 「チャット」から「自律実行」へ Windowsを“エージェントOS”に変える「Copilot Tasks」の波紋

0

2026年03月03日 15:10  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

「Copilot Tasks: From Answers to Actions」の解説ページ

 Microsoftは2月26日(米国時間)、複数のアプリやサービスをまたいで特定の手順に沿ってタスクを実行する「Copilot Tasks」を発表した。


【その他の画像】


 現在はResearch Previewの形で展開されており、一部ユーザーを対象に提供が行われている。対象者は徐々に拡大されていく予定で、興味ある人はウェイティングリストに登録しておくといいだろう。


 Microsoftが数多く展開する“Copilotシリーズ”の1つではあるが、今回はやや異なる意味を持つと筆者は考えている。日々、PCやスマートフォンなどで行っている作業を「Copilot Tasks」の“タスク”の1つとして考え、毎日あるいは決まった曜日にルーチンのように実行したり、あらかじめ示した手順で必要に応じて処理を実行させたりできる。


 説明では「バックグラウンドで自動実行されるTo-Doリスト」のような表現もされているが、おそらくWindowsの利用スタイルを大きく変える一歩と呼べる機能ではないだろうか。


 CopilotがWindowsの検索機能の一部として活用されるようになって久しいが、現状はあくまでユーザーの問い合わせに対して応答しているに過ぎない。


 解説ブログの表題にあるように「“回答(Answer)”から“アクション(Action)”へ」とMicrosoftではその位置付けの変化を説明しており、ユーザーからの問い合わせに対応するだけだった“チャットボット”の世界から、実際にユーザーがWindows上で行う数々の作業をAIが自律的にバックグラウンドで処理するようになり、従来のGUIとは異なった使い方をWindows上で実践していくことになる。


●Copilot Tasksでは何ができるのか


 同ブログにYouTubeでの解説動画のリンクが貼られているが、例として次のようなものが挙げられている。


・定期タスク:「毎晩、緊急メールとその返信の下書きを表示し、過去一度も未開封のプロモーションメールを自動で購読解除」「月曜の朝に重要な会議や出張の概要の書き出し」


・ドキュメント作成:「講義概要(シラバス)から模試を作成して試験前の学習時間の確保」「メールボックス内のファイルや要素を基にスライド資料を作成」


・買い物や予約など:「パーティ計画で会場検索と予約、招待状の送付と出席管理」「近くで評判の配管業者を探しての見積もり比較と予約」


・ロジスティクス:「フライトに合わせた配車予約と遅延時の調整」「ホテル料金の監視と自動再予約」


 これらは、実際にCopilot Tasksチームが内部でテストを実践したものだというが、日々の業務でルーチンのように実行しているものもあれば、ドキュメント作成のように必要に迫られて必要なタイミングで実行するもの、パーティー計画のように立案から実行までの期間にわたって管理が必要なもの、あるいは毎日や毎週やるものではないが、旅行の際のホテルを少しでも安く予約するために不定期に何度か実行する作業まで、タスクを自動化できるようだ。


 主に備忘録的な使い方が多いと思われるTo-Doリストには載せないような無意識のルーチンワークも含め、Copilot Tasksではカバーされると考えていい。


 マウス操作やキーボード入力、アプリケーションの起動と操作、ブラウザでの各種行動を自動化するツールは既に存在し、古くから利用されている。


 最近ではさらに複雑な操作や処理まで可能なRPA(Robotic Process Automation)やノーコードのツールが出回っており、プログラミング知識のいらない業務効率化ツールとして吹聴されているが、Copilot Tasksの対人インタフェースはあくまで生成AIを活用した自然言語であり、CopilotやChatGPTに語りかけるような指示で問題ない。


 自動化手順を記録した“マクロ”を逐次呼び出すのではなく、Copilot Tasksに対して作業指示を口頭で出すイメージで、前述のような期間や対象範囲がバラバラなタスクをバックエンドで実行してくれる。


●他の類似サービスとの違いは「クラウド動作」と「仲介者としての役割」


 生成AIを使って同様の仕組みを提供するサービスとして、OpenAIの「Operator」や「Frontier」がある。


 前者のOperatorはクライアントPC操作に特化したサービスで、主にブラウザでの操作の自動化を可能にする。例えば、前述のホテル検索から予約までといった流れをOperatorに任せることで、ユーザーの代わりに自動実行してくれる。


 Frontierは企業向けのエンタープライズ利用を想定しており、社内システムと連携するAIエージェントを統括してビジネスプロセス全体を自動化する。BPA(Business Process Automation)やBPM(Business Process Management)などとも呼ばれる仕組みで、ServiceNowなどの専業ベンダーが存在する。


 Copilot Tasksは、このOperatorとFrontierの中間に近い存在だと思われ、動作としてはOperatorのそれに近いが、内部的にはFrontierのように“Microsoftのクラウド”内に存在するデータやアプリケーションを主な対象に、その他のサービスもAIエージェントを介して接続し、それら複数のAIエージェントを束ねる形で動作している。


 AIエージェント同士を連携させて仲介するのがCopilot Tasksの役割であり、こういった仕組みは「指揮者(Orchestrator)」などとも呼ばれる。


 PC操作を主眼とする仕組みでありながら、実際の動作はクラウド上で行われており、例えばWordやExcel、PowerPointといったアプリケーションの操作もクラウド上で行われ、スライドやドキュメント作成もローカルではなくクラウド上のアプリケーションとして動作している。


 データはMicrosoft 365やMicrosoft Graphといったものが参照されるため、必ずしも普段作業を行っているPCからCopilot Tasksに指示を出す必要はなく、タブレットやスマートフォンを含めCopilot+ PCのようなNPU搭載などのハードウェア要件を満たさない別デバイスからでも操作が可能だ。


 ブラウザ関連の操作もクラウド内で動作するので、動作(操作)デバイスを選ばないといえる。加えて、クラウド上で常に動作し続けるため、操作を開始したデバイスに電源が入っていなくても問題ない。ユーザーが必要に応じて状況を確認すればいい。


 ただ、これだけではMicrosoft 365のデータが中心となってしまうので、実際には外部からSaaSで提供されるサービス、自社内で構築しているサービスやAIエージェントと連携してタスクを実行したいというケースもあるだろう。そこでMCP(Model Context Protocol)の登場となる。


 MCPは外部のデータやツールに対し、大規模言語モデル(LLM)のようなAIエージェントがアクセスするための標準仕様として米Anthropicが開発したプロトコルで、このプロトコルを使って別のAIエージェントにデータやツール(AIエージェントを含む)への“入り口”を提供するのがMCP Serverとなる。


 つまり、外部のパブリッククラウドのデータや自社システムのデータなどはMCP Server経由でCopilot Tasksに“触らせる”ことで、実行可能なタスクの一部として取り込むことが可能だ。


 実際にサービスにまだ触れているわけではないため、現在出ている情報から判断した範囲ではあるが、概念図をGoogleのNano Banana 2に作成させた。ユーザーからの指示を受けてクラウド上で常時動作するのがCopilot Tasksで、実際の動作はMicrosoftクラウド内の各種データやアプリケーション、また専用の領域として動作しているブラウザ環境上で呼び出した複数のAIエージェント、MCP Server経由で入手した各種データや連携先のAIエージェントを通し、タスクを完遂させようとする。


 MCP Serverの安全な接続にはOAuth 2.1の認証が用いられるが、おそらくEntra IDの利用も可能だと思われる。


 現在はまだResearch Previewということで実質無料で提供されているCopilot Tasksだが、おそらくは将来的にMicrosoft 365に付随する「Copilotプラン」の一部として提供されることになると思われる。通常のMicrosoft 365の契約プランに加え、Copilotの追加契約が必要になるが、かつて噂された「Windowsがサブスクリプションモデルに移行する」といった話も、このようなクラウドを利用した新しい機能やサービスの追加という形で実質的に実現されるのではないだろうか。


 Copilot Tasksの登場により、Windowsの何かがすぐに劇的に変化するというわけではないものの、これまで当たり前のようにGUIなどで行っていた作業の一部が自然言語で置き換えられた。これにより、作業が丸ごと“ユーザーの手”から離れたわけで、このような形で今後もWindows上で行われていた作業や機能の一部が少しずつAIエージェントによって置き換えられていく……というのが「エージェントOS」の未来の姿の一端なのではないかと筆者は考えている。


 まだ最終形は見えないものの、Windows 95のブームで爆発的に増加したPCユーザーのUI/UXの世界は、30年の時を経て少しずつ変わりつつあるのだろう。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定