← ブログ

MaxClawレビュー:実際のワークフローでテスト(正直な評価)

5つの実際のワークフローでMaxClawをテストしました。実際に機能したこと、不満だったこと、そして2026年にサブスクリプションの価値があるかどうかをお伝えします。

1 min read
MaxClawレビュー:実際のワークフローでテスト(正直な評価)

やあ、みんな。Doraです。最近、ずっと同じ小さな摩擦につまずいていました。それは、集中力を奪う単純な複数ステップの雑務です。「3つのリンクをざっと読んで、まともなまとめを作り、Telegramのチャットに送る」とか、「40ページのPDFを解析してリスクを抽出し、ドキュメントに短いメモを残す」といったことです。どれも難しくはありません。ただ、一日を必要以上に重く感じさせてしまう類いのタスクなのです。

そこで、2週間にわたって MaxClaw を試してみました。私が監視しなくてもそういった雑務をこなせるかどうかを確かめたかったのです。機能をランク付けするつもりはありません。一日を軽くしてくれるかどうかを体感したかった。それが評価基準です。

MaxClawのテスト方法(環境とユースケース)

MaxClawをmacOS(M3 Air)、Chrome、iOSで使いました。ベースラインとして、私は普段、必要に応じてNotion + Zapier + Claude APIラッパーで小さなエージェント的なフローを組んでいます。Webhookの配線はできますが、メンテナンスは好きではありません。

ユースケースはごく普通のものでした:

  • リサーチのキャプチャ: 3〜6つのソースを読み、「退屈だが真実の」核心を抽出し、週次メモ用に使っているTelegramチャンネルに転送する。
  • スケジューリングの橋渡し: 2つのカレンダーを調整し、候補時間を提案し、何かが決まったら確認メッセージを送る。
  • ドキュメントの読み通し: 長いPDFをスキャンし、決定事項・リスク・ToDoを抽出して、短いレポートを作成する。

測定したのは3つです:

  • セットアップ時間: サインアップから最初の有用な実行までの分数。
  • 監視負荷: タスクごとの修正・書き直しの回数。
  • ドリフトまたはメモリ: 数日後、プロンプトなしで設定を覚えているかどうか。

繰り返しによって摩擦が減るかどうかを確認するため、各ワークフローを5〜7回実行しました。派手な「初回デモ」よりも、それの方が私には重要です。

オンボーディングと第一印象

サインアップから最初の実動タスクまでの時間

サインアップはシンプルでした。メール、認証、プランの選択。 ストップウォッチで計ったわけではありませんが、最初の実動タスクまで約18分でした。一番時間がかかったのはMaxClawではなく、何を自動化するか決めること自体でした。最初は小さなリサーチ→まとめ→Telegram通知から始めました。

驚いたのは、デフォルトのテンプレートが派手でなかったことです。点滅するお祝いアニメーションも、「アウトプットを10倍に…」という雰囲気もありません。その控えめさは好感が持てました。

プラットフォーム連携の体験

Telegramは少し手間がかかりました。BotFatherでボットを作成し、トークンを取得してMaxClawに貼り付けます。チャットIDは手動で設定する必要がありました。難しくはありませんが、経験者を前提にしています。初めての方は、製品のツールチップよりもTelegram Bot APIのドキュメントの方が分かりやすいです。

カレンダー連携はよりスムーズでした。Googleの認証が素早く完了し、空き時間・予定時間のブロックが初回から正しく表示されました。重複したカレンダーも出ませんでした(地味に安心しました)。

ドキュメントについては、28ページの戦略デッキ(PDF)と43ページのリサーチレポート(PDF)をアップロードしました。解析は、待ちながらメールに気が散るほどの時間はかかりませんでした。公開リンクを使って1回試したところ、問題なく取得できましたが、権限周りの奇妙な挙動を避けるため、直接アップロードに統一しました。

実際のワークフローテスト

テスト1:リサーチ+まとめ+Telegram送信

4つのソースを渡しました:ブログ記事1つ、プレスリリース1つ、技術的なメモ1つ、フォーラムのスレッド1つ。指示は「ソース付きで6〜8箇条の落ち着いたまとめを作り、Telegramチャンネルに送って。

1回目:まとめ自体はよかったが、文体がやや興奮気味でした。スタイル指示を「平易で、宣伝っぽくない」に調整。2〜6回目は落ち着いたトーンを維持しました。小さな勝利:3回目(一度修正後)から、生のURLではなくソースのタイトルを添付するようになりました。Telegramでのリンク崩れもなく、ツールが過剰にフォーマットすると起きがちな問題が出ませんでした。

時間の節約は? 1回目はトーンとソースのフォーマット修正に約10分かかり、時間は節約できませんでした。4回目には確認作業が約2分に短縮。劇的な変化ではないですが、精神的な負荷は下がりました。 構造を頭に保持し続ける必要がなくなったのです。

テスト2:複数ステップのスケジューリングタスク

来週、2つのカレンダーの間で45分の候補時間を3つ提案し、午前を優先して、相手が返信で選択したら短い確認メモを作成するよう指示しました。タイムゾーンを正しく処理できました(私はUTC+1、相手はET)。「午前6時はどうですか?」などと余計なことはしませんでした。

確認メッセージは中立で明確でした。 私が送信ボタンを押す前に「ミーティング承諾済み」と仮定しなかった点がよかったです。最終的なスロットは私が承認する必要がありました。率直に言って、その方が好きです。意図せず確定させてしまったら、謝るのは私自身ですから。

テスト3:ドキュメント分析とレポート生成

これが本当のテストでした。43ページのレポートを読んで、以下を出力するよう指示しました:

  • 平易な言葉での主要な決定事項、
  • 可能性と影響度(低/中/高)付きの3つのリスク、
  • ノートに貼り付けられる1ページの概要。

1回目はそこそこでしたが長すぎました。2ページ分の出力でした。最大350ワードと指定すると、以降の実行では守りました。リスク評価は落ち着いていて、過度に警告的ではありませんでした。PDFに表が含まれている場合、再現しようとせずに要約してくれました。良い判断です。

怪しいと感じた2つの主張をクロスチェックしました。実際には問題なく、レポートの付録に記載されていました。とはいえ、私自身が確認せずにクライアントに渡すことはしません。これは思考補助ツールであり、最終的な起草ツールではありません。

長期的なメモリ機能 — 実際に機能するのか?

短い答え:まあまあです。そしてそれで十分です。

初日にMaxClawにいくつかの常設の設定を伝えました:

  • トーン:平易で、宣伝っぽくない
  • Telegramのまとめ:タイトル付きのソースで6〜8箇条
  • スケジューリング:仮押さえを避けて、自分の時間帯の午前を優先

1週間後、そのルールを再度伝えずに同じタスクを実行しました。トーンとまとめの長さは覚えていました。ソースのタイトルを一度忘れましたが、次の実行では復活しました。仮押さえのルールは安定していました。「午前優先」を「9〜17時ならいつでも」に変更すると、その変更もすぐに反映されました。

コストの内訳

サブスクリプションでカバーされる内容

料金は変わる可能性があるため、最新情報は製品ページで確認してください。WaveSpeedのMaxClaw解説によると、「MaxClawを作成」をクリックしてから実行中のエージェントゲートウェイが起動するまで20秒以内で、オプションの連携はガイド付きの手順で行い、最小限の設定で済むとのことです。テスト期間中、サブスクリプションには以下が含まれていました:

  • 組み込み連携(Telegram、カレンダー、ドキュメント)付きエージェントへのアクセス、
  • 月間タスク実行数とドキュメント処理のプール、
  • APIキーを管理せずに済む、ホスト型のモデル利用。

私にとって価値があったのは「無制限」の何かではありませんでした。グルーコードをメンテナンスしなくて済むことでした。Webhookを監視したり、シークレットが期限切れになっていないか心配したりしなくてよかったのです。時間が細切れになりがちな方には、それだけでも価値があります。

Claude APIでOpenClawを動かす場合との比較

「OpenClaw」の安定した公式ドキュメントは見つけられませんでした。「DIYエージェント+Claude」を考えているなら、Claude APIを使った私の普段の計算式はこうです:

  • モデル(例:Claude 3.5 Sonnet)の料金は、入力トークン100万件あたり数ドル程度、出力はそれより高めで推移しています。執筆時点では、AnthropicはMillion単位の料金を公表しています:正確な数字は彼らのページで確認してください。
  • 私の典型的なリサーチ→まとめの実行コストはドル単位ではなくセント単位です。重い作業(長いPDFの複数パス)は積み上がりますが、それでも1日数ドルを超えることはほとんどありません。
  • 隠れたコスト:リトライ・認証スコープ・エラーハンドリング・カレンダー・Telegramボットの細部を配線する時間。それが楽しい場合(私もそういうことがあります)は問題ありません。そうでなければ、とにかく動くサブスクリプションの方が実質的に安くなる場合があります。

MaxClawが本当に得意なこと

  • アイデアから実動フローまでが速い。 ビルダーUIに苦労したり、「あともう一つトグル」に午後を費やしたりしませんでした。
  • 引き渡しの瞬間をうまく処理する。 メッセージを下書きして、承認を待ち、それから続行します。その小さな一時停止が、過度な自動化から守ってくれました。
  • ドキュメントの消化が信頼できる。 表を幻覚したり、存在しない構造を無理やり作ったりしません。まとめに根拠がある感覚がしました。
  • 小さな設定に対するメモリが十分に機能する。 スタイルと小さなルールが1週間、繰り返しなしで維持されました。
  • TelegramとカレンダーのIntegrationが安定していた。 重複投稿もなく、タイムゾーンの失敗もありませんでした。そういった問題が起きることに慣れていましたが、今回は見られませんでした。

まだ足りないところ

  • 初回実行のトーンが明るめにぶれることがある。 乾いた中立的なトーンが欲しければ、明示的に指定してください。
  • メモリは設計上、浅い。 スタイルや繰り返しの設定には有効ですが、複雑なプロジェクトのコンテキストには向きません。重要なプロンプトは今でもメモに保管しています。
  • デバッグの手段が限られている。 何かミスが起きたとき(ソースのタイトルが消えたときなど)、ログが簡素です。修正はできましたが、もっと明確な「理由」が知りたかったです。
  • ソースの帰属には誘導が必要。 サイト名から著者を推測することがありました。修正は簡単ですが、まとめを広く共有する場合は注意が必要です。

最終評価 — MaxClawは誰に向いているか?

毎日が小さな繰り返しの雑務、まとめ、通知、軽いスケジューリングで溢れていて、ボットやスクリプトをメンテナンスしたくない方には、 MaxClawを試してみる価値があります あなたを驚かせることはありません。そしてそれがポイントです。注目を求めることなく、仕事をこなしてくれました。

こんな方に向いています:

  • 静かなTelegramやSlackのフィードにリサーチメモを溜めている個人クリエイター、
  • ミニシステムを構築せずに予測可能なスケジューリングのつなぎが欲しいオペレーターやPM、
  • 長いドキュメントからコンパクトな概要が必要で、トーンを安定させるための十分なコントロールを求めているリサーチャー。

このMaxClawレビューを一言で表すなら:初日が終わると、「どうやって」に費やす時間が減り、結果を読む時間が増えた。そのわずかな解放感、タブの減少、マイクロな意思決定の減少こそが、本当の勝利でした。より複雑なクロスツールのプロジェクトでどう振る舞うかはまだ気になっています。静かに、引き続き見守っていきます。