AI開発者ニュース #7: Fable 5、Herdr、Notion 3.6

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。

これは有料購読者向けのボーナストラックコンテンツです。
AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。
形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。

今回は、Fable 5 の全世界復帰、Herdr の注目を先に扱い、続いて Notion 3.6、xAI Voice Agent Builder、Cognition の Devin Security Swarm、Cursor での Kimi K2.7、Devtools 系を見ます。

Fable 5 の全世界復帰

7 月 1 日、Anthropic は Fable 5 is back と全世界での復帰を告知しました(Redeploying Fable 5 の Update 欄)。輸出規制解除と、週次利用制限の最大 50% を Fable 5 に充てる措置は前号で触れた通りです。当日は ClaudeDevs が 5 時間・週間のレートリミットを全員分リセットしたことも話題になりました。

再展開では新しい分類器セットが入り、サイバーセキュリティタスクのブロック範囲が広がっています。ルーチンなコーディングやデバッグの一部が Opus 4.8 へフォールバックする点も含め、当日はその実運用面の報告が増えました。

Prompting Claude Fable 5 では、プロンプトやスキルで「内部推論を応答に書け」と指示すると reasoning_extraction 拒否カテゴリが発火し、Opus 4.8 へのフォールバックが増えると書かれています。デバイス切り替えを宣言しただけで Fable 5 から Opus 4.8 に落ちたという報告も出ていました(Tom Bombadil)。

Fable 5 はトークン消費が大きく、5 時間枠を短時間で使い切る観測が多く出ています。Theo 氏は Fable 5 で大量の PR をマージしつつ $200 プランのレートリミットに達していないと述べ、サブエージェントや安いモデルへの委譲で Fable 5 の枠を節約する運用を示唆しました(Theo続き)。Diego 氏は Fable 5 をオーケストレーター、Opus を深い推論サブエージェント、Sonnet を機械的作業、Codex を別視点のシニアエンジニアに割り当てる構成を紹介していました(Diego)。宮川達彦さんは opusplan と環境変数で Plan Mode だけ Fable 5、それ以外は Sonnet 5 にする設定を共有しました(宮川達彦)。

品質とコストの比較では、Atomic Chat が 4 モデルに同じプロンプトで HTML5 Canvas の物理デモ 3 シーンを作らせ、Fable 5 が最高品質だが Opus 4.8 の約 6 倍コストだったと報告しています(Tips Excel)。Fable 5 は 62,158 トークン・$3.12、GPT 5.5 は 37,753 トークン・$1.14、Opus 4.8 は 22,280 トークン・$0.56、GLM 5.2 は 36,246 トークン・$0.08 です。Armin Ronacher 氏は pi と Claude Code で同じ Fable 5 でもハーネス次第で体感が大きく違うと書いていました(Armin Ronacher)。

Herdrの注目

Herdr は、Ghostty や iTerm など既存ターミナル内で動く Rust 製エージェントマルチプレクサです。PTY セッションの detach / reattach、SSH 越しのリモートアタッチ、blocked / working / done / idle の状態検知、CLI と socket API でのエージェント制御が compare ページ で整理されています。cmux や Warp のような独立 GUI アプリではなく、ターミナル内にエージェントの状態を載せるツールです。

7 月 1〜2 日、日本語圏の CLI エージェント利用者の間で、cmux や tmux から Herdr へ乗り換えた報告が相次ぎました。宮川達彦さんは cmux を高く評価しつつ Terminal + tmux から Herdr へ移し、tmux を超えた進化版のように感じると述べています(宮川達彦)。栗林健太郎さんは cmux でエージェントオーケストレーションしていた環境を Herdr に置き換え、継ぎ足しだったオーケストレーションコードを一から書き直したと報告しています(栗林健太郎)。

運用面では、Claude Code と Codex の並走や、Fable 5 に司令塔だけ任せて横のペインで Codex を動かす構成など、複数エージェント運用の利点が繰り返し挙がりました(naoyaMichie)。pane runpane read でペインを開いて出力を読む API は cmux ユーザーからも好評でした(nunulk)。tmux のヘビーユーザーは、Rust ベースで本体を改造しやすい点を評価しています(peinán)。一方、キーバインドの慣れや tmux スクリプトで同等のことができるという留保もあります(delphinustumf)。

日本語の実践記事では、「Herdr」を使い始めたら、もう他のターミナルには戻れなくなった に状態検知、Agent Orchestration、skill.md をエージェントに読ませる手順、Ghostty との組み合わせがまとめられています。Claude Code、Codex、OpenCode 向け統合は GitHub にあり、brew install herdrcurl -fsSL https://herdr.dev/install.sh | sh で入れられます。

Notion 3.6 の External Agents と HTML ブロック

Notion は 7 月 1 日、Notion 3.6 を出しました。中心は、CLI や IDE に閉じていたエージェントへ、チーム共有のボードから @ メンションでタスクを渡せる External Agents です。初回は Claude と Cursor が対象です。

同リリースでは、Notion Agents がページ上に インタラクティブな HTML ブロック を作れるようになりました。ROI 計算機、クイズ、組織図などを Notion 内に置き、チームで編集できます。AI Meeting Notes の話者ラベル、PPTX / XLSX / DOCX の読み書き、Outlook 連携、Mercury / Mixpanel / Miro / Box / ClickHouse など 5 つの MCP 接続も同梱です。Opus 4.8、Grok 4.3、GLM 5.2 など複数モデル選択と、Enterprise 向け Custom Agent の audit log も載っています(Notion)。

xAI Voice Agent Builder

xAI は 7 月 1 日、Grok Voice 上でノーコードで本番向けボイスエージェントを組める Voice Agent Builder を beta 公開しました(xAI)。STT・LLM・TTS を別々に繋ぐのではなく、speech-to-speech の Grok Voice パス一本に telephony、ナレッジ、ツール、ガードレール、MCP、オブザーバビリティを載せた構成です。

エージェント音声は $0.05 / 分、プロビジョニング済み電話番号の telephony は追加 $0.01 / 分です。80 超の内蔵ボイス、約 2 分の音声からのクローン、SIP 経由の既存番号接続、ブラウザ内テストに対応します。開発者向けには Voice Agent API があり、フラッグシップは grok-voice-think-fast-1.0 です。OpenAI Realtime API 互換の WebSocket 接続を wss://api.x.ai/v1/realtime に向け替える移行パスも docs に書かれています。

Cognition の Devin Security Swarm

Cognition は Devin Security Swarm を紹介しました(Cognition)。複雑なコードベースのセキュリティ脆弱性探索向けで、Agentic MapReduce アーキテクチャに基づくと説明されています。

並列エージェントがコードベースの区間を調査し、ビジネスロジックの欠陥や認証バイパスの連鎖などをファイル横断で追います。個別の発見を攻撃経路に合成し、隔離サンドボックスで実行時に悪用可能か確認したうえでパッチ PR を開く流れです。Cognition は、検証済み脆弱性の発見コストが近い代替手段より 30% 低いと述べています。マルチエージェントの実用パターンについては Multi-Agents: What's Actually Working に map-reduce-and-manage の整理があります。

Cursor で Kimi K2.7

Lee Robinson 氏は 7 月 1 日、Cursor で Kimi K2.7 を試せると案内し、CursorBench 3.1 で GLM 5.2 との比較を見るよう促しました(Lee Robinson)。同日、Cursor フォーラムでも Colin 氏が Kimi 2.7 の利用開始と Kimi 2.5 の 7 月 3 日廃止予定を告知しています(forum)。CursorBench 3.1 では Kimi K2.7 Code が 52.7%、タスクあたり $1.92、GLM 5.2 Max が 54.6%、$3.11 です。GLM 5.2 High は 50.7%、$2.46 で、スコアは K2.7 を下回ります。世代比較では Kimi 2.6 が 47.6%、Kimi 2.5 が 31.9% で、K2.7 は大きく上がっています。CursorBench は小さな差が統計的に意味を持たない場合もあると注記しています。

Kimi K2.7 Code は Moonshot AI のコーディング特化オープンウェイトモデルで、Modified MIT ライセンス、256K context、API は $0.95 / $4.00 per MTok です。GLM 5.2 と同様、picker の組み込みモデルとして選べます。ベンチの散布図では、スコア重視なら GLM 5.2 Max、コスト重視なら K2.7 という差が出ています。

Devtools 系

OpenCode /reload: dax 氏は、OpenCode 2.0 でスキルのホットリロードのために再設計に時間がかかったと説明しました。エージェントにスキルを作らせるか手動で追加すると、キャッシュを壊さず即座に拾われる仕組みです(dax)。/reload コマンドや /experimental/hotreload エンドポイントが config / skills / MCP をセッションを殺さず再読み込みする方向で、PR #9871PR #13409 に実装が載っています。

Sakana Fugu on OpenCode: Sakana AI は Fugu のマルチエージェントオーケストレーション検証に OpenCode を使い、Fugu を OpenCode から利用可能にしたと案内しました(Sakana AI)。Fugu は OpenAI 互換 API の単一エンドポイントで、学習済みルーティングが複数の frontier モデルを束ねます(Fugutechnical report)。

Claude Code /dataviz: v2.1.198 で組み込みスキル /dataviz が追加されました(Daniel San)。チャートとダッシュボードのデザインガイドラインをコンテキストに読み込み、チャートタイプ選択、レイアウト、データ量の多い UI の視覚階層を扱います。

Claude Managed Agents: ClaudeDevs は、ストリーミングセッションイベントのデルタ、セッションごとのエージェントオーバーライド、新しい webhook イベントタイプ、リバースペジネーション、認証情報インジェクションのスコープを追加したと案内しました。webhook は session.status_idledsession.outcome_evaluation_ended など主要な状態変化を通知し、ペイロードは event type と ID のみで、受信側が GET で最新状態を取る設計です(webhooks docs)。

Zed v1.9: Zed v1.9.0-pre では、ピッカーモーダルのドラッグリサイズと、ファイルファインダー・テキストファインダーのライブプレビューが追加されました。text finder: toggle で別 UI のプロジェクト検索も開けます(Zed)。Agent Panel 内検索や Agent ターミナルコマンドのサンドボックス設定も同梱です。

shot-scraper video: Simon Willison 氏は shot-scraper 1.10shot-scraper video を追加したと報告しました。storyboard.yml に URL、クリック、待機、シェルコマンドを並べ、Playwright で WebM を録画します。コーディングエージェントが作業デモを残す用途を想定していると説明しています(Simon Willison)。

terraform-log-viewer: Daniel Lockyer 氏は Terraform の plan / apply ログをドロップするだけで、待機時間の大半を占めるリソースを可視化する OSS を公開しました(Daniel Lockyer)。あるクライアントの実行時間を 85% 短縮できたと述べています(terraform-log-viewer)。

Hermes Agent v2026.7.1: Nous Research は v2026.7.1 — The Judgment Release を出しました(Nous Research)。P0 / P1 issue をゼロにしたうえで、Mixture-of-Agents のファーストクラス化、/goal の completion contracts、バックグラウンド subagent、gateway の scale-to-zero と drain 調整が changelog の中心です。