Claude vs OpenAI Operator:Windows上の「Computer Use」比較

気になっているので調査。

ざっくりまとめ

  • ClaudeGUIベースのPC操作を自動化でき、LibreOfficeFirefoxを介してExcelやWebフォームも操作可能。ただしLinux環境が前提で、処理速度は遅め。
  • OpenAI Operatorクラウド上で仮想ブラウザを操作しWeb業務を代行。Excelなどのデスクトップアプリ操作には非対応だが、自然言語で指示でき手軽に使える。
  • どちらもまだベータ段階であり、誤動作・実行速度の課題は共通。導入目的と技術リソースに応じた選定が重要。

📊 機能比較表(2025年7月時点)

観点 Claude ComputerUse OpenAI ComputerUse
アーキテクチャ概要 Docker上の仮想デスクトップにて、Claudeがスクリーンショットを見ながらマウス・キーボード操作 GPT-4ベースCUAモデルが、仮想ブラウザ上で自律操作(スクリーンショットとアクションループ)
Windows対応状況 Windows上ではDocker経由でのみ利用可能(Linux前提) ChatGPT版はOS問わず使用可能。Azure版はWindows環境にも対応(限定プレビュー)
ブラウザ操作 Firefox等のGUIブラウザを画像認識してクリック操作(誤操作しやすく遅い) 仮想ブラウザを自然言語で操作。複数タブ・スクロール対応。ログインは人手介入要
Excel操作 LibreOffice経由でExcel形式を読み書き・計算可能。マクロには非対応 Excel Onlineのフォーム入力などWeb越し操作は可能。直接制御は不可
Word/PowerPoint LibreOffice Writer/Impressを操作可能 操作不可(オンラインOffice含む)
必要ライブラリ Docker, anthropic SDK, 仮想X環境(Xvfb等) ChatGPTは不要、Azure版は openai + azure-identity + Playwrightなど
ネットワーク要件 APIと外部Web接続が必要。ログイン情報の自動入力は非推奨 ChatGPTは自動Webアクセス可。認証や決済はユーザ確認必須
セットアップの容易さ Docker前提でやや難。Python+環境構築のスキル要 ChatGPTは即時使用可。Azure版は技術要・制限付き
速度・安定性 遅くて誤操作が起きやすい。無限ループに入ることも 遅め。誤情報あり。詰まるとユーザに制御を戻す設計
代表的ユースケース Excel集計 → Web登録、文書の差し込み入力、UIテストなど Web予約・問い合わせ入力・情報収集・カスタマーサポート支援など
制限事項 ドラッグ・スクロールに弱い。ループ・暴走あり。β機能限定 ブラウザ以外非対応。ログイン・決済は不可。現在は米国限定提供
料金体系 APIトークン課金(画像も課金対象) ChatGPT Pro(月額\$20)内蔵。Azure版はトークン課金
セキュリティ スクリーン上の指示検出、ユーザ確認必須。機密データは学習対象外 認証操作は人間任せ。ログアウト機能あり。プライバシー設定可能

💡 導入シナリオ別の推奨

シナリオ 推奨
📊 Excelの自動レポート作成 Claude(LibreOfficeベースでファイル直接編集可能)
🌐 Webフォーム入力代行 ChatGPT Operator(フォーム自動入力可能・自然言語で操作)
📑 ExcelからPowerPointへ転記 Claude(複数アプリ間操作が可能)
👨‍💼 非エンジニアでも使いたい OpenAI Operator(ChatGPTから即利用可能)
🔒 セキュリティ厳格な閉域システム Claude(ローカル環境完結でデータ流出しない)

📎 参考文献リスト

出典 URL
Anthropic: Computer Use 概要 https://docs.anthropic.com/claude/docs/computer-use
Anthropic: Claude 3.5 発表 https://www.anthropic.com/news/claude-3-5-sonnet
OpenAI: Operator 紹介 https://openai.com/blog/operator
Azure OpenAI Computer Use Docs https://learn.microsoft.com/en-us/azure/ai-services/openai/use-computer-use
Reddit 検証スレッド(Claude) https://www.reddit.com/r/ClaudeAI/comments/
Reddit 検証スレッド(ChatGPT) https://www.reddit.com/r/ChatGPTPro/comments/
DataCamp Operator解説 https://www.datacamp.com/blog/openai-operator

🧩 補足(図・コード例)

ClaudeでExcel自動編集するスクリプト例(Python

from anthropic import Anthropic
from your_agent_env import launch_container, send_screen, run_loop

client = Anthropic(api_key="sk-...")
container = launch_container("claude-excel-env")

while True:
    screenshot = container.capture()
    response = client.messages.create(
        model="claude-3-opus",
        tools=[{"name": "computer_use"}],
        messages=[{"role": "user", "content": screenshot}]
    )
    action = parse_response(response)
    container.perform(action)

OperatorでWeb自動入力(ChatGPT UI上)

Task: Go to https://example.com/form and fill out the following:
Name: John Smith
Email: john@example.com
Comment: This is a test submission.

🖼️ 図解①:Claude vs OpenAI Operator アーキテクチャ比較

flowchart LR
  subgraph Claude[Claude Computer Use]
    A1[User Prompt]
    A2[Claude 3.5 Model]
    A3[Docker Container<br>(Linux仮想デスクトップ)]
    A4[アプリ操作例<br>Firefox, LibreOffice Calc]
    A5[スクリーンショット画像]
    A1 --> A2
    A2 --> A5
    A5 --> A2
    A2 -->|Action command| A3
    A3 --> A4
  end

  subgraph Operator[OpenAI Operator]
    B1[User Prompt]
    B2[GPT-4 CUAモデル]
    B3[仮想ブラウザ<br>(クラウド上)]
    B4[Webページ操作<br>フォーム入力・検索]
    B5[スクリーンショット画像]
    B1 --> B2
    B2 --> B5
    B5 --> B2
    B2 -->|Command| B3
    B3 --> B4
  end

解説:

  • Claude はDocker上の仮想環境でローカルアプリを操作
  • Operator はクラウド上の仮想ブラウザを操作し、ローカルアプリには非対応。あなたのPCのEdgeやChrome、エクセル等を直接動かすことはできません。

📘 図解②:Claudeを使ったExcel自動集計のフロー(例)

sequenceDiagram
    participant Dev as 開発者
    participant Claude as Claude API
    participant Env as Docker環境
    participant Calc as LibreOffice Calc
    participant Web as 社内Webシステム

    Dev->>Claude: 指示入力(例:売上データ集計してWeb登録)
    Claude->>Env: コンテナ起動+スクリーンショット取得
    Env->>Calc: Excelファイル読み込み
    Claude->>Calc: セル編集・合計計算
    Calc-->>Env: スクリーンショット更新
    Claude->>Web: Webフォームへ自動入力
    Web-->>Claude: 完了画面返却
    Claude->>Dev: 処理完了レポート

シナリオ例

  1. 指定されたフォルダからExcelを開き、
  2. B列の売上数値を合計し、
  3. 結果を社内Webシステムの入力フォームに貼り付ける

🔐 図解③:ChatGPT Operator のユーザー介入ポイント(ログイン・CAPTCHA

sequenceDiagram
    participant User as ユーザー
    participant GPT as Operator Agent
    participant Browser as 仮想ブラウザ

    User->>GPT: フォーム記入指示(ログインが必要)
    GPT->>Browser: サイトにアクセス
    Browser-->>GPT: ログインページ表示
    GPT-->>User: 「ログイン情報が必要です」
    User->>Browser: 手動ログイン実行
    Browser-->>GPT: 認証済みページ表示
    GPT->>Browser: フォームに入力開始

補足: Operatorは実際の物理ブラウザを操作するわけではなく、OpenAIがホスティングする「仮想ブラウザ」を内部的に操作します。そのためPCのChromeやEdgeが動くわけではありません。画面遷移・操作は仮想環境内で完結しており、ユーザーが介入すべきポイント(例: ログイン、CAPTCHA)はモデルが停止して案内を出す仕組みです。

フォールトトレラント量子コンピューティングが見せた実用化への光 — 量子エラー訂正ブレークスルーまとめ

なぜ今、この技術が注目されているのか

  • 2025-06-27Quantinuum が論理エラー率を物理エラー率以下に抑えた「ブレークイーブン」を達成し、フォールトトレラント(FT)量子ゲート集合を実証
  • 2025-06-24IBM が 156 量子ビット Heron プロセッサ搭載 IBM Quantum System Two を日本に導入し、HPC と量子のハイブリッド運用を開始
  • 「量子はまだ使えない」という通説に対し、実用規模を視野に入れた決定的な一歩として世界中で報道ラッシュ

既存技術と何が違うのか

従来(NISQ世代) フォールトトレラント世代
数十〜数百物理 Qbit短い回路のみ 論理ゲート誤り率 ≤ 物理ゲート → 長い回路も実行可能
エラー訂正は実験段階/オーバーヘッド大 魔法状態蒸留+コードスイッチング で物理 Qbit 数を 1 桁削減
主流は 127 Qbit EagleIBM 156 Qbit Heron:2 Qbit エラー率 1×10⁻³、速度 250 kCLOPS

メリット(なぜ嬉しいのか)

  • スケール性:物理ビット増設コストと時間オーバーヘッドを約 1/10 に短縮
  • 精度量子化学・最適化アルゴリズムで桁違いの計算精度を確保
  • ハイブリッド化:富岳 × System Two のように HPC と量子を命令レベルで統合可能

影響を受けるビジネスと具体例

業種 インパク 具体例
製薬 分子シミュレーションを高精度・高速化 抗がん剤候補の活性部位探索
新素材 量子化学計算で材料探索を網羅 全固体電池の新電解質設計
金融 リアルタイム最適ポートフォリオ 1 日ごとのリスク最小化再計算
物流 ルート/積載の組合せ最適化 DHL の動的配車システム
エネルギー 送電網潮流のリアルタイム最適化 再エネ比率の高い地域グリッド

問題・懸念点

  1. 物理 Qbit は依然数百規模:実用アルゴリズムに必要な数千〜数百万ビットにはまだ遠い
  2. 低温装置・人材コスト:極低温デバイス導入費と専門技術者不足
  3. 暗号破壊リスク:ポスト量子暗号移行に伴うインフラ更新コスト
  4. 環境負荷:クライオ装置の電力消費増大

今後の展望

  • Quantinuum:2029 年までに FT 量子機「Apollo」を市場投入と公言
  • IBM:17 日ごとに量子システムを出荷するロードマップで同時期の FT 達成を目指す
  • 2025–2027 年:HPC+量子ハイブリッドにより「限定的量子優位」事例が各産業 PoC から報告される見込み
  • クラウド SaaS:数百論理 QbitAPI 提供するサービスが普及し、「量子ネイティブ」な業務システム開発が加速

まとめ
フォールトトレラント量子コンピューティングは「まだ遠い未来の技術」から「実用ロードマップが描ける技術」へ大きくステージアップしました。新薬開発や新素材探索など 計算量が爆発する領域 では、今後 2–3 年でビジネス実装フェーズに入ると予想されます。一方、環境負荷や暗号移行といった課題も顕在化するため、技術革新と社会実装を両輪で進める姿勢 が成功の鍵となるでしょう。

mjaiむけに麻雀AIを開発したい(準備編)

mjaiという麻雀AI対戦サーバの仕組みがあるのでこれのAIを開発してみたい
gimite.net

とりあえず対戦サーバをインストールして動かすところまでは以下とかを見てできるのだが自分で新しいAIを作ってみようと思うとなかなか大変だったのでメモ
麻雀AI対戦サーバMjaiのインストール #Ruby - Qiita

方針

何事にも先達はあらまほしきことかなというのが持論なので誰かが作ったものを改造していきましょう。
本件gimiteさんの王道AIであるhttps://github.com/gimite/mjai-manueをベースにします。

  • ライブラリ取得

本体であるmjaiとmjai-manueをローカルにcloneしましょう。
https://github.com/gimite/mjai
https://github.com/gimite/mjai-manue

で、ここから動かすのが結構めんどかった。
まずわかりにくかった点としてmjai-manueはruby版とcoffee-script版がいる。ここに気づかなくて途中だいぶ意味不明であった。

coffee で動かす場合

coffeeで動かす場合。mjai-manue/coffee/README.txtにある通り

$ sudo npm install -g coffee-script
$ coffee main.coffee

とかで動かせる。

シャン点君3人と戦わせるとすると

mjai server --host=127.0.0.1 --port=11600 --game_type=tonnan --room=default --log_dir=./log "mjai-shanten mjsonp://127.0.0.1:11600/default" "mjai-shanten mjsonp://127.0.0.1:11600/default" "mjai-shanten mjsonp://127.0.0.1:11600/default"

でサーバ側を起動しておいて

coffee main.coffee mjsonp://127.0.0.1:11600/default

とかでよい。

ruby版を動かす場合

普通にGemとして起動してみましょとぱこーんと打つとうごかない

~/mjai-manue/bin$ ruby mjai-manue mjsonp://127.0.0.1:11600/default
Could not find compatible versions

Because every version of mjai depends on sass = 3.1.0
  and sass = 3.1.0 could not be found in locally installed gems,
  mjai cannot be used.
So, because Gemfile depends on mjai >= 0,
  version solving has failed.

ほほう。ライブラリがないのねーってことでgemsepc見ながら必要なものを追加するのですが、
gem install sass -v 3.1.0
gem install nokogiri -v 1.6.0
gem install bundler -v1.0.0
bundlerはデフォ扱いなのでダウングレードできないし、nokogiriは古いバージョンのビルドに失敗する。
ってことでgemspecのdependencyを書き換えてしまう。

  s.add_dependency("json", [">=1.6.0"])
  s.add_dependency("nokogiri", [">=1.6.0"])
  s.add_dependency("bundler", [">=1.0.0"])
  s.add_dependency("sass", [">=3.1.0"])

これで無事動くようになった。
ruby mjai-manue mjsonp://127.0.0.1:11600/default

はて、これでやっとそーすをいじれるようになったぞ!

ubuntu 20.04にRuby最新版(3.3.3)をインストールしようとしたときのメモ

インストールしてたらうまくいかない。
なんでmakeでしっぱいしているんだ?とエラーログをみてみたら

$ cat /tmp/ruby-build.20240614002810.14585.B5EatY/ruby-3.2.4/ext/psych/mkmf.log
LD_LIBRARY_PATH=.:../.. pkg-config --exists yaml-0.1
package configuration for yaml-0.1 is not found
find_header: checking for yaml.h... -------------------- no

ほーん。ヘッダーが見れなくなったのか。リリース履歴をみたら3.2以降libyamlが同梱されなくなったから個別に入れなきゃダメってことらしい。
ということでいつも通りぽいっと入れてみようにも入らない。。。

$sudo apt upgrade
$sudo apt update
$ sudo apt install libyaml
Reading package lists... Done
Building dependency tree
Reading state information... Done
E: Unable to locate package libyaml
$ sudo apt install install libyaml-dev
Reading package lists... Done
Building dependency tree
Reading state information... Done
E: Unable to locate package install

他にも依存があるのか。。。ってちょっと調べたらこんな記事があって
github.com

不足する可能性のあるものを全部入れておけばOKとのことでぶち込む。

sudo apt install git curl libssl-dev libreadline-dev zlib1g-dev autoconf bison build-essential libyaml-dev libreadline-dev libncurses5-dev libffi-dev libgdbm-dev

無事完了した。

$ rbenv install 3.3.3
==> Downloading ruby-3.3.3.tar.gz...

% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 21.0M 100 21.0M 0 0 200M 0 --:--:-- --:--:-- --:--:-- 200M
==> Installing ruby-3.3.3...

  • > ./configure "--prefix=$HOME/.rbenv/versions/3.3.3" --enable-shared --with-ext=openssl,psych,+
  • > make -j 8
  • > make install

==> Installed ruby-3.3.3 to /home/azureuser/.rbenv/versions/3.3.3

NOTE: to activate this Ruby version as the new default, run: rbenv global 3.3.3

$ rbenv global 3.3.3
$ ruby -v
ruby 3.3.3 (2024-06-12 revision f1c7b6f435) [x86_64-linux]

めでたしめでたし。

command 'azureVirtualMachines.createVirtualMachine' not found

久々に自宅の環境いじってたらめっちゃおっちょこなことしてたので備忘メモ

VSCodeからAzureにつないでいじろうとしたら以下エラー。

コマンド azureVirtualMachines.createVirtualMachine の実行中にエラー command 'azureVirtualMachines.createVirtualMachine' not found が発生しました。azureVirtualMachines.createVirtualMachine を提供する拡張機能が原因である可能性があります。

az loginはできていてサイドバーにほかのVMは見えているけどホスト接続などができない。
試しにVM作ってみようとしても上記のようなエラーになる。
CLIはインストールしてあるしPowerShellから直でたたけばできるのに何が起こったのかと悩むこと30分。
きづきました。WSLにつないでいたのでWSLからつなごうとしてしまっていたということでした。
なのでWSL接続を切ってやり直したら無事成功。

やれやれだぜ

ダイエットの数学

半年ほど前に主治医から痩せないとやばいよって忠告をいただいたのでダイエットしてみたので考え方を整理してみる。

まず基本的なところとして減らすべき脂肪のことを知るのが大事
・脂肪1キロ=7200kcal=体積1.2リットル

なので、毎日240kcal減らすと1っか月で1キロやせる。

・240kcalの目安
 ご飯お茶碗1杯
 発泡酒ロング缶1本
 どら焼き1つ
 ジョギング27分
 ウォーキング50分

1日の消費カロリー
基礎代謝 1500kcal
・一日総消費カロリー(TDEE) 2300kcal

つまり、論理上1日2060kcalにおさえて生活すれば1キロやせていくとはいえ飲み会があったりして日によって2000kcalぐらいオーバーすることを考慮して
1月12000kcalぐらい減らすつもりで生活すると1キロやせる。
12000/30=400なので1900kcalぐらいで月1キロ
20000/30=660なので1640kcalぐらいで月2キロペース

探索型のプロダクト開発を始めよう~正しいものを正しくつくる2.0~

デブサミでのぱぱんだこと市谷さんのセッション。
静かな語り口で熱い想いがあるのがいい。最後の下は”次は君の番”という感じでやっぱデブサミはこうでなくては。

  • プロダクト開発とは何か
    • プロダクトは利用者の目的を果たし価値をもたらすこと。仮説検証、試す使う、
  • プロダクトを作る までだとダメ、
    • ユーザーに使ってもらいアウトカムが発生してるかにこだわる
    • アウトカムは収益ではない!収益は動力源だが、結果的な後続指標でしかない。
  • 成果とは持続的な提供、
    • ユーザーチームぷろだくとが健康な状態
    • しかしこれが一定ではない。
    • 今の判断はいつの根拠によるものなのか?はるか昔に得た情報で判断していないか?
    • わかってることだけやってもジリ貧。わかってないことにいどんでいこう
  • 成果とは何かに向き合う
    • まずは探索バックログの1つを積むことから始めよう
    • なんどもやってマチュリティを上げていくのが狙いだ
    • 熱意を持てるものを選んでやるのだ
  • 成果とは何か?むきなおりをはじめよう
  • DEVSUMIは世界を変えてきたと思うが、DEVSUMIが変えたんじゃない。刺激を受けたおのおのが自分の世界をかえてきたんだ