#AIエージェント #AgentPuter #ソフトウェア革命 #OpenClaw #Claude

ソフトウェア革命前夜、あなたのエージェントには専用のコンピュータが必要だ

AIエージェントは驚くほど有能です。しかし、彼らには自分の家も、永続的なワークスペースも、専用のコンピュータもありません。AgentPuterがそれを変えます。

@ AgentPuter Lab
$
~ 読了時間 15分

1. はじめに:ソフトウェアは再定義されつつある

過去40年間、ソフトウェアの基本的なインタラクションパラダイムは、本質的に変わることがありませんでした:人間がソフトウェアを操作し、ソフトウェアが指示を実行する。

1984年のMacintoshのグラフィカルインターフェースであれ、2024年の最新SaaS製品であれ、その根底にあるロジックは同じです。人間がボタンをクリックし、フォームに入力し、ファイルをドラッグする。ソフトウェアは忠実にこれらのアクションを実行します。ソフトウェアは道具であり、人間は操作者です。

しかし、2024年から2025年にかけて、状況は変わり始めました。

AnthropicのClaude Computer Useは、AIが人間のようにコンピュータを操作することを可能にしました。OpenAI Operatorは、AIが自律的にウェブを閲覧し、タスクを完了させます。無数のスタートアップがAIエージェントを構築し、人間の代わりにAIに実作業をさせようと試みています。

新しいパラダイムが生まれつつあります:エージェントがソフトウェアを操作し、人間が指示を与える。

これは素晴らしいことに聞こえます。しかし、実際にエージェントに仕事をさせようとすると、根本的な問題が浮かび上がります。

エージェントはどこで「生活」し、「仕事」をするのか?

彼らには自分のコンピュータも、デスクトップも、ファイルシステムもありません。会話が終わるたびに「消滅」し、次回はゼロからやり直しです。

この記事では、その問いへの答えを探ります:あなたのエージェントには、自分専用のコンピュータ、つまりAgentPuterが必要だ、と。


2. 最近の兆候:革命はすでに始まっている

解決策を議論する前に、すでに何が起きているかを見てみましょう。最近の3つの出来事が、この変革の様相を明確に示しています。

2.1 「Claudeクラッシュ」:AIがソフトウェアを喰らうとき

つい今週(2026年2月)、ウォール街が「Claudeクラッシュ」と呼ぶ事態で、トムソン・ロイターの株価が22%も急落しました。

引き金となったのは、AnthropicがひっそりとリリースしたClaude向けの法律モジュールです。市場は、トムソン・ロイターが6億5000万ドルで買収したCoCounsel(本質的には同社のデータベースのAIラッパー)が、判例を直接読んで分析できる基盤モデルに対して無防備であることに気づいたのです。

これは、かつてリーガルテックの寵児だったRobin AIの破綻に続くものです。シリーズBで2600万ドルを調達した後、追加の資金調達に失敗し、2025年後半にディストレスト・セール(経営不振企業の売却)に出されました。ここから得られる教訓は、ユーザーは、直接ソース(AI)にアクセスできるのに、レガシーなワークフローに「AI機能」を振りかけただけのものにはお金を払わないということです。

2.2 Claude、Excelに侵攻

2025年10月、AnthropicはClaude for Excelをリリースし、Microsoft Copilotに宣戦布告しました。

これは単なる「AIアシスタント」ではありませんでした。金融の専門家はExcelのサイドバーでClaudeと直接会話し、ワークブック全体をゼロから分析、修正、さらには構築することさえできました。自然言語で質問すると、Claudeはセルレベルの参照付きで回答を返します。数式が壊れていれば、Claudeがデバッグします。財務シナリオをテストしたい?説明すれば、Claudeがモデルを構築します。

さらに重要なことに、Anthropicは同時に7つのリアルタイム市場データプロバイダー(Aiera、Chronograph、Egnyteなど)を接続しました。これは、ClaudeがExcelを操作するだけでなく、生の金融データに直接アクセスできることを意味します。

重要なシグナル: AIはもはや「ヘルパー」であることに満足していません。ユーザーのコアワークフローに入り込み、主要な推進力になりたがっているのです。

2.3 OpenClawの台頭:オンデバイスのパーソナルアシスタントが爆発的に普及

従来のソフトウェア企業の苦闘とは対照的に、あるオープンソースプロジェクトが爆発的な成長を遂げています。

ローカルで実行されるプライベートAIアシスタントプラットフォームであるOpenClaw(旧Clawdbot/Moltbot)は、2026年初頭までにGitHubスター17万4000、フォーク2万8000以上を獲得しました。最初の1週間だけで14万5000以上のスターと200万人の訪問者を獲得し、CNBCは「世界中で熱狂と恐怖を生み出している」と評しました。

OpenClawとは何か?簡単に言えば、Mac mini、Linuxサーバー、Raspberry Pi、あるいはVPSといった自分自身のハードウェア上でプライベートAIアシスタントを実行できるプラットフォームです。Telegram、WhatsApp、Discord、iMessage経由でメッセージを送ると、チャットではなく、実際のタスクを実行してくれます。

何ができるのか?

  • 財務管理: hledgerを使って取引を自動分類。
  • タスク追跡: Linearのissueを個人のToDoと同期。
  • サーバー運用: SSH経由でNixOSの設定を管理。
  • メディア: Jellyseerrで映画を自動リクエスト。

ユーザーは、エージェントに新しいツールの使い方を教えるためのカスタムSkills(シンプルなMarkdownファイル)を作成します。

重要なシグナル: ユーザーは「より良いソフトウェア」を必要としているのではありません。自分の代わりに仕事をしてくれるエージェントを必要としているのです。OpenClawはそれを証明しました。しかも、それはオープンソースで、ユーザー自身のハードウェア上で動作します。


3. 簡潔な歴史:ソフトウェアの3つの時代

AgentPuterが何を意味するのかを理解するために、ソフトウェアの進化を振り返る必要があります。

3.1 ローカルソフトウェア時代(1980年代~2000年代)

ソフトウェアはローカルにインストールされ、データもローカルに保存されました。

CDを買い、PCにMicrosoft Officeをインストールしました。ドキュメントはハードドライブ上にあり、別のコンピュータに移るとアクセスできませんでした。ソフトウェアは「製品」であり、一度支払えば所有できました。

代表例:Microsoft Office、Adobe Photoshop、AutoCAD。

定義的な特徴: 強力だが孤立している。データは一台のマシンに閉じ込められていました。

3.2 クラウドSaaS時代(2000年代~2020年代)

ソフトウェアはクラウドで実行され、ブラウザがゲートウェイでした。

インストールは不要で、ブラウザを開くだけ。データはサーバー上にあり、コンピュータを切り替えてもすべてがそこにありました。ソフトウェアは「サービス」となり、月額で支払うことで、いつでも利用可能になりました。

代表例:Google Docs、Figma、Notion、Slack。

定義的な特徴: 便利だがネットワークに依存する。データは他人のサーバー上にありました。

3.3 AIネイティブ時代(2020年代~?)

AIのために設計されたソフトウェア。エージェントが主要なユーザーです。

これが私たちが突入しつつある時代です。ソフトウェアはもはや人間の操作を待つ単なるツールではなく、エージェントが直接呼び出せる能力(capability)です。人間は「操作者」から「司令官」へとシフトします。

この時代を定義する製品は…?

それこそが、AgentPuterが答えようとしている問いです。


4. エージェントのジレンマ:有能だが、家がない

今日のAIエージェントは驚くほど有能です。

4.1 エージェントに何ができるか?

  • 自然言語の指示を理解する: 平易な言葉で何をすべきか伝えると、それを理解します。
  • 複雑なタスクを分解する: 大きなタスクを与えられると、それを小さなステップに分解し、一つずつ実行します。
  • ツールを使って仕事をこなす: ウェブを検索し、ファイルを読み書きし、APIを呼び出し、ソフトウェアを操作します。
  • 自律的に意思決定し、自己修正する: 問題に直面したとき、手取り足取り教えられなくても回避策を見つけます。

純粋な能力の点では、エージェントはすでに若手社員のように機能できます。しかし、ここに問題があります。

4.2 エージェントに欠けているもの

「身体」がない。 エージェントはAPIやスクリーンショットを通じてしかソフトウェアと対話できません。彼らにはマウスもキーボードも、自分自身のディスプレイもありません。ソフトウェアを操作するには、そのソフトウェアがAPIを提供しているか(ほとんどは提供していません)、エージェントがスクリーンショットを撮り、それを分析し、どこをクリックするかを決定し、クリックを実行し、またスクリーンショットを撮る…という手順を踏む必要があります。1つのアクションに数秒かかり、非常に脆弱です。わずかなUIの変更がクリックミスを引き起こす可能性があります。

「家」がない。 すべての会話はゼロから始まります。前回あなたのために整理したファイルは?消えています。書きかけだった調査レポートは?失われています。エージェントには永続的な環境、つまり「デスクトップ」も「フォルダ」もありません。

「作業台」がない。 既存のソフトウェアは人間向けに設計されています。美しいUI、複雑なインタラクション、リッチな視覚的フィードバック。しかし、エージェントはそれらのいずれも必要としません。彼らが必要なのは、クリーンなインターフェース、安定した状態、そして予測可能な振る舞いです。人間にとっての「ユーザーフレンドリー」と、エージェントにとっての「ユーザーフレンドリー」は全くの別物です。

4.3 厄介な現状

現在の主流なソリューションはすべて、明らかな限界を抱えています。

Computer Use(スクリーンショット+クリック): エージェントに人間のように画面を見させ、マウスをクリックさせる。普遍的に聞こえますが、非常に非効率です。スクリーンショットを撮り、分析し、クリック位置を決定し、クリックを実行し、結果を見るためにまたスクリーンショットを撮る…。単純なアクションに数秒かかります。そしてエラーも起こりやすいです。わずかなUIの変更がミスを引き起こす可能性があります。

MCP / Function Calling: エージェントに呼び出すためのAPIを与える。効率的ですが、カバレッジに限界があります。ソフトウェアベンダーがインターフェースを提供している場合にしか機能しません。ほとんどは提供していないか、インターフェースが制約されすぎています。

Pluginモデル: エージェントはソフトウェア内の「プラグイン」として存在する。しかし、それではエージェントは「ゲスト」で、ソフトウェアが「ホスト」です。エージェントができることは、完全にソフトウェアの裁量に委ねられます。

これらすべてのアプローチに共通する問題は、エージェントが常に他人の家で暮らしているということです。彼らには自分の領土も、主権もありません。


5. AgentPuter:エージェント専用のコンピュータ

エージェントに家が必要なら、建ててあげましょう。

5.1 AgentPuterとは何か?

AgentPuterは、エージェントのために設計されたコンピューティング環境です。

この環境では、エージェントは第一級市民(first-class citizen)です。 ソフトウェア、ファイル、インターフェースはすべてエージェントのために設計されています。人間は観察者であり司令官です。エージェントに何をすべきかを伝え、その仕事ぶりを見守り、必要なときに介入します。

これは(Computer Useのように)人間の操作をシミュレートすることではありません。エージェントの操作をネイティブにサポートすることです。エージェントは「画面を見る」必要がありません。なぜなら画面がないからです。エージェントは「マウスをクリックする」必要がありません。なぜならインターフェースを直接呼び出すからです。

5.2 基本理念

従来のソフトウェアAgentPuter
人間向けに設計されたUIエージェント向けのAPI + 人間が観察するためのUI
人間がクリックして操作エージェントがインターフェースを直接呼び出し
ファイルはローカルまたはクラウドに保存ファイルはエージェント専用のワークスペースに保存
一回限りの会話永続的なエージェントのワークスペース

一言で言えば: 従来のソフトウェアは人間のための道具です。AgentPuterはエージェントのためのコンピュータです。

5.3 中核となる価値提案

AgentPuterは単なる機能リストではありません。バリューチェーンにおいて5つの重要な役割を果たします。

1. Privacy Proxy(ファイアウォール) これはユーザーにとってAgentPuterの最も重要な価値です。自分の銀行の認証情報をChatGPTに貼り付けることはないでしょうが、ローカルで実行されるAgentPuterなら信頼できます。ユーザーとLLMの間のミドルウェアとして機能し、データをサニタイズし、認可を管理し、データ所有権がユーザーの手元に残ることを保証します。

2. Context Manager(メモリ) LLMは記憶喪失ですが、AgentPuterは長期記憶を持っています。長期間にわたるワークフロー、個人の好み、ファイル履歴を構造化された長期記憶に変換します。LLMと対話する際には、現在のタスクに関連するコンテキストのみを抽出し、高価なトークンコストを節約しつつ精度を向上させます。

3. Unified Interface(アダプター) ドキュメント処理からメールまで、AgentPuterのすべての機能は、エージェントがネイティブに呼び出せる標準化されたToolとしてラップされています。これにより、基盤となるAPIの複雑さが抽象化され、エージェントは人間がマウスを使うのと同じくらい自然に機能を呼び出すことができます。

4. Persistent Workspace(デスク) エージェントは自分自身の「デスクトップ」を持ちます。書きかけのファイル、収集したリサーチ資料、中間生成物など、すべてが保存されます。次のセッションは、前のセッションが終了したところから再開されます。

5. Accountability Black Box(ログ) 人間はエージェントが何をしているかをいつでも見ることができます。AgentPuterはすべての意思決定チェーンと操作を記録します。エージェントが機密性の高いアクション(例:ファイルの削除、送金)を実行する際には、システムが自動的に一時停止し、人間の確認を求めます(Human-in-the-loop)。

5.4 OpenClawからの教訓

OpenClawの爆発的な普及は、AgentPuterのテーゼを裏付けています。しかし、それは同時にギャップも明らかにしました。それこそが、AgentPuterがより良くできる点です。

OpenClawが達成したことAgentPuterがさらに進む点
ローカルで実行、プライバシー保護同じくローカルファーストだが、より簡単にdeploy可能(技術的背景不要)
MarkdownファイルによるカスタムSkills視覚的なオーケストレーションを備えた、よりリッチなSkillsマーケットプレイス
メッセージングアプリ経由でトリガーマルチエントリー:メッセージング、音声、デスクトップアプリ、ショートカット
開発者フレンドリー非技術系ユーザーにもアクセス可能
シングルエージェントマルチエージェント連携

OpenClawは需要の存在を証明しました。AgentPuterの使命は、この能力を誰もが利用できるようにすることです。


6. ユースケース

AgentPuterは抽象的な概念ではありません。実際にどのように機能するかを見てみましょう。

6.1 オフィスワーク

従来の方法: Wordを開いて文書を作成し、Excelでスプレッドシートを作り、Outlookでメールを送る。すべてのアプリケーションで、あなたの手作業による操作が必要です。

Claude Excelのアプローチ: Excel内のAIアシスタントを使ってデータを分析する。しかし、それ以外のことは?依然として手作業です。

AgentPuterのアプローチ: エージェントに「先週の売上データをレポートにまとめて、マネージャーに送って」と指示する。エージェントはデータを取得し、分析を実行し、レポートを作成し、フォーマットを整え、メールを送信します。あなたは最終的な成果物を確認するだけです。

違いは、Claude Excelが「AIがソフトウェアに入る」のに対し、AgentPuterは「エージェントを中心に設計されたソフトウェア」である点です。前者は機能強化であり、後者はパラダイムシフトです。

6.2 リサーチ

従来の方法: 何十ものブラウザタブを開き、ノートアプリにコピー&ペーストし、手作業で整理・統合する。

AgentPuterのアプローチ: 「2025年のEV市場のトレンドを調べて」と言う。エージェントは自律的に検索し、記事を読み、要点を抽出し、レポートを作成します。エージェントは独自の「リサーチノート」を持っており、プロセスと結果の両方が保存され、いつでもフォローアップできます。

6.3 開発

従来の方法: コードを書き、テストを実行し、バグを修正し、deployする。すべてのステップであなたの注意が必要です。

AgentPuterのアプローチ: エージェントは独自の開発環境とコードリポジトリを持っています。あなたが要件を説明すると、エージェントがコードを書き、テストを実行し、バグを修正します。行き詰まったときにはあなたに質問しますが、ほとんどの作業を独立して処理します。

6.4 クリエイティブワーク

従来の方法: Figmaでドラッグ&ドロップし、Photoshopでレイヤーを調整し、ピクセル単位で作業する。

AgentPuterのアプローチ: エージェントは独自の「キャンバス」と「アセットライブラリ」を持っています。あなたが望む結果を説明すると、エージェントが初稿を生成し、イテレーションを重ね、バージョンを保存します。あなたはクリエイティブディレクターとして、エージェントはデザイナーとして機能します。


7. AgentPuterと既存アプローチの比較

次元Computer UseMCP / PluginsClaude ExcelOpenClawAgentPuter
インタラクションスクリーンショット+クリックAPIコールサイドバーチャットメッセージトリガーネイティブエージェントインターフェース
効率性中〜高
永続性なし限定的限定的あり(ローカル)完全なワークスペース
人間からの可視性見えるが理解困難見えない見える部分的に見える見えて理解可能
カバレッジ理論上は普遍的ベンダー依存ExcelのみSkillsで拡張可能エージェント専用に構築
Deploymentクラウドクラウドクラウドオンデバイスローカルファースト
ユーザーの障壁高(技術的)

まとめ:

  • Computer Useは普遍的だが非効率なフォールバック
  • MCP / Pluginsはベンダーの開放に依存し、カバレッジが限定的
  • Claude Excelは強力な一点突破だが、Excel限定
  • OpenClawは方向性は正しいが、参入障壁が高すぎる
  • AgentPuterはOpenClawの哲学とアクセシビリティの目標を組み合わせている

8. 技術アーキテクチャ

8.1 全体アーキテクチャ:バリューチェーンのハブ

AgentPuterのアーキテクチャは単なる階層設計ではありません。それは曖昧な人間の意図と、決定論的なデジタル出力をつなぐミドルウェアです。下位層に対しては複雑なAPIや環境の詳細を抽象化し、上位層に対してはシンプルで自然なインタラクションインターフェースを提供します。

AgentPuter アーキテクチャ

ユーザーエントリー層: メッセージングアプリ(Telegram, WhatsApp, iMessage)、音声アシスタント、デスクトップアプリケーション、システムショートカット、直接のAPIコールなど、エージェントをトリガーする複数の方法をサポートします。

オーケストレーション層: AgentPuterの「脳」。ユーザーの意図を受け取った後、タスクを計画し、実行可能なステップに分解し、能力モジュールをディスパッチし、全体の状態を管理します。

実行層: ドキュメント処理、スプレッドシート、メール、ウェブアクセス、コード実行、カレンダー管理、ファイル操作、サードパーティAPIなどの具体的な能力モジュール。Skills Marketもサポートします。

永続層: エージェントの「記憶」。ファイルシステム、状態データベース、ベクトルストア。すべて暗号化され、ローカルファーストです。

8.2 認証永続化システム

「再起動のたびに再認証」問題を解決する鍵。

認証永続化システム
  • セキュアなストレージ: すべての認証情報は暗号化して保存され、平文では決して保存されません。
  • 自動更新: OAuth 2.0のRefresh Tokenメカニズムをサポート。トークンは有効期限が切れる前に自動的に更新されます。
  • ヘルスチェック: 定期的に認証状態を検証し、問題があれば事前にユーザーに通知します。
  • 最小権限: タスクに必要な権限のみを要求します。

8.3 ドキュメント構造理解エンジン

エージェントがドキュメントを単なる生テキストとして扱うのではなく、真に「理解」できるようにします。

ドキュメント構造理解エンジン
  • 構造解析: 見出しの階層、段落の境界、リスト構造を認識します。
  • テーブル理解: ヘッダー、データ行、結合セルを識別します。
  • スタイル認識: 「見出し1」「本文」「引用」などの意味的なスタイルを理解します。
  • インクリメンタル編集: 元のフォーマットと構造を維持しながらドキュメントを修正します。

8.4 操作ロールバックシステム

エージェントの操作が可逆的であることを保証し、ユーザーがいつでも「元に戻す」ことができるようにします。

操作ロールバックシステム
  • 操作ログ: すべてのアクションの詳細情報を記録します。
  • 状態スナップショット: 主要なチェックポイントで完全な状態スナップショットを保存します。
  • 選択的ロールバック: 任意の過去の状態にロールバックできます。
  • 不可逆アクションの保護: メールの送信やAPIコールなどのアクションには確認が必要です。

8.5 マルチエージェント連携フレームワーク

複雑なタスクに対して、同じワークスペース内で複数のエージェントが連携することをサポートします。

マルチエージェント連携フレームワーク
  • 役割の専門化: 異なるエージェントが異なる種類のタスクを担当します。
  • 共有コンテキスト: 中間結果は共有ワークスペースを通じて渡されます。
  • メッセージベースの通信: エージェントはメッセージキューを介して連携します。
  • 競合解決: 複数のエージェントが同じリソースを修正する際のロックおよびマージメカニズム。

8.6 Deployment:ローカルファースト+クラウドオプション

Deployment アーキテクチャ

ローカルファースト: デフォルトでは、AgentPuterはユーザーのデバイス上でローカルに実行されます。データがユーザーの管理下から離れることはありません。

クラウドオプション: ユーザーは、24時間365日の運用、クロスデバイス同期、および重い計算のオフロードのためにCloud Podを有効にすることができます。


9. 展望:ソフトウェアの未来の形

誰もが自分だけのエージェントチームを持つようになります。 1人ではなく、多数のエージェントです。文章作成に長けたエージェント、データ分析が得意なエージェント、デザインが得意なエージェント。彼らはあなたのAgentPuter内で協力し、あらゆる種類のタスクを処理します。

ソフトウェアはエージェントの「スキル」になります。 Officeはもはやあなたが使うアプリケーションではなく、あなたのエージェントが持つ能力です。「私のエージェントはExcelが使える」という言葉が、「私の従業員はExcelが使える」と言うのと同じくらい自然になります。

人間は操作者から司令官へとシフトします。 ExcelでVLOOKUPを書く方法を知る必要はもうありません。ただ、どんな結果が欲しいかを知っていればいいのです。

ユーザーは「より良いオフィスソフト」を必要としているのではありません。自分の仕事を完遂してくれるエージェントを必要としているのです。そして、そのエージェントには自分専用のコンピュータが必要です。

私たちの使命は、すべての人に自分だけのAgentPuterを提供し、AIエージェントが本当にあなたのために24時間365日働けるようにすることです。


10. 結論:操作者から司令官へ

ソフトウェア革命の前夜において、最大の機会は人間とコンピュータのインタラクションを再定義することにあります。

PCの時代、人間は操作者(Operator)でした。私たちがCPUでした。私たちが疲れると、仕事は止まりました。 AIの時代、人間は司令官(Commander)であるべきです。エージェントはデジタルな労働力です。AgentPuterは24時間稼働の工場です。

AgentPuterは単なる製品名ではありません。新しいメンタルモデルです:

人間(CEO)→ AgentPuter(デジタル工場)→ 成果物(納品)

リーガルテック株の暴落。ClaudeのExcelへの侵攻。OpenClawの爆発的な普及。これら3つの出来事は、革命が始まったことを告げています。あなたのエージェントには、自分専用のコンピュータを持つ資格があるのです。


参考文献とさらなる読み物