AI開発者ニュース #2: GLM-5.2、Agent skill、Bun Rust rewrite

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。

💡
これは有料購読者向けのボーナストラックコンテンツです。
AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。
背景は昨日公開した Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。
今は実験的に全ユーザーへメール配信していますが、本運用では有料購読者のみへの配信に切り替える予定です。

今回扱う話題は、GLM-5.2 の Cursor / Devin 対応、GLM-5.2 の評価とRLインフラ、Agent skill の書き方、Gemini 3.5 Flash の Computer Use、Cursor と Notion 連携、Bun の Rust rewrite 進捗などです。

GLM-5.2 が Cursor / Devin に入る

Z.ai の GLM-5.2 は、オープンウェイト寄りのコーディングモデルとして最近よく流れています。今回はモデル単体の評価だけでなく、実際の開発ツールへの統合が増えていました。

Cursor では Fireworks 経由で GLM-5.2 を試せるようになり、Cursor 側の評価結果も共有されていました。オープンソースモデルをより使いやすくしていく取り組みとして紹介されています(Lee Robinson)。

Devin Desktop と CLI でも Kimi K2.7 Code と GLM-5.2 が利用可能になりました。Cognition は、自社の実エンジニアリングタスク向けベンチマーク FrontierCode Extended で GLM-5.2 が 43.0%、Kimi K2.7 Code が 39.5% だったと出しています(Cognition)。

GLM-5.2 の評価とRLインフラ

GLM-5.2 と Opus 4.8 を、インフォグラフィック、SVG、サイト生成などで比較した GLM Arena も流れていました。GLM-5.2 は平均で2倍のトークンを生成しつつ、それでも速く、3倍安く、品質は同等だったという報告です(Hassan)。

Terminal Bench では、GLM-5.2 は Opus より37%多いターンを使い、どちらも45タスク中25タスクを完了、コストはGLMが46%だったという追加分析も出ていました(Aiswarya Sankar)。

Prime Intellect は、GLM-5系でRLを回すためのインフラとして prime-rl v0.6.0RL at 1T Scale を出しています。131k context の agentic SWE task、trillion-parameter MoE scale、prefill/decode の最適化が中心です(elie)。

Agent skill の書き方と検証

Matt Pocock が、エージェント向け skill によくある曖昧な指示を指摘していました。「コミットメッセージを非常に詳細に書く」「徹底的に行う」「実装を読みやすくする」のような文は、もっと具体化できるという話です(Matt Pocock)。

Visual Explainer という agent skill では、出力品質を落とさずにトークンを80%削減し、10K語以上の指示を2K語にしたという更新が出ていました。複雑な内容をHTMLページとして説明するための skill と slash command のセットです(Nico Bailon)。

/no-mistakes は GitHub Trending に入っていました。リポジトリは kunchenguid/no-mistakes。エージェントに作業させたあと、または既存のコミット済み作業に対して、テストや検証のゲートを走らせる agent-native な仕組みです(Kun Chen)。

Hermes Agent は、コード、APIドキュメント、マニュアル、PDF、設定ファイルなどのディレクトリから、検証可能で再利用可能な skill を蒸留する /learn を案内していました(Teknium)。

エージェント環境モデルとComputer Use

Qwen は Qwen-AgentWorld を発表しました。公式記事は Qwen-AgentWorld: Language World Models for General Agents。MCP、Search、Terminal、SWE、Web、OS、Android の7つのエージェント環境を単一モデル内でシミュレートする language world model とされています(Qwen)。

Google は、Gemini 3.5 Flash で Computer Use を組み込みツールとして使えるようにしたと発表しました。公式ブログは Introducing computer use in Gemini 3.5 Flash、ドキュメントは Computer Use、リリースノートは Gemini API changelog。ブラウザ、モバイル、デスクトップ環境を扱えると説明され、試用用の google-gemini/computer-use-preview も更新されています(Patrick Loeber)。

Notion から Cursor にタスクを委任する

Cursor は、Notion から直接 Cursor にタスクを委任できるようになったと発表しました。公式ブログは How Notion used the Cursor SDK to embed coding agents。Notion 側のドキュメントにも Connect Cursor to a custom agent が出ています。

Notion のドキュメント内で Cursor をタグ付けしたり、スレッドでメンションしたり、データベースの issue を割り当てたりできる、という説明です。裏側は Cursor SDK で、クラウドエージェントは Cursor と同じモデル、ハーネス、ランタイムで動くとされています(Cursor)。

Factory も Slack thread から使うエージェントで、モデルと作業する Droid を選べると案内していました。公式ドキュメントには Factory Slack integration があります(Factory)。

Atlassian は、Slackで @Jira をメンションして会話から作業項目を作成、更新、割り当てできるようにしました。公式ブログは Introducing @Jira、サポート記事は Use Jira Cloud for SlackAtlassian)。

Agent harness: Traycer, OpenClaw, Hermes

Traycer は、複数のコーディングエージェントを1つのデスクトップ画面で動かすための AI orchestration app です。デスクトップアプリをリリースし、リポジトリは traycerai/traycer、公式サイトは traycer.ai。既存の Claude、Codex、Opencode などのサブスクリプションを持ち込み、エージェント間通信やループを扱えると説明されています(Traycer)。

The New Stack に、OpenClaw と Hermes Agent を比較する記事が出ていました。記事は OpenClaw and Hermes agree on what an agent is. They disagree on what controls it

OpenClaw はゲートウェイから始まり、WhatsApp、Discord、Slack など複数チャンネルで1つのエージェントを使う方向。Hermes はメモリから始まり、開発者の文脈を数週間にわたって持ち、スキルを改善していく方向、という整理が共有されていました(Richard Seroter)。

Google の ADK と A2A を使い、Python と Go のエージェントが互いに発見して会話するデモも出ています。公式ブログは Build Cross-Language Multi-Agent Team with Google's Agent Development Kit and A2ARichard Seroter)。

Trampoline AI は、再帰的言語モデル CLI エージェント Fractal を出しました。公式サイトは fractal.trampoline.ai。ターミナル上で質問応答、タスク計画、ファイル読み書き、コマンド実行、コードベース調査を行うエージェントとして紹介されています(Emile Riberdy)。

Bun の Rust rewrite 進捗

Bun v1.4 は7月7日に出る予定です(Jarred Sumner)。文脈は、5月に merge された Rewrite Bun in Rust の後続です。Jarred Sumner は5月時点で、Rust版が Linux x64 glibc 上で既存テストの99.8%を通したと書き、理由としてメモリリーク、クラッシュ、安定性問題への対応コストを挙げていました(99.8% tests理由)。

この移植については、ベンチマーク、メモリ使用量、今後のメンテナンス性、具体的な移植プロセスを扱うブログ投稿があると5月に予告されていました(Jarred Sumner)。6月11日には、Rust書き直し版の v1.4 リリースに残っている主な障害は「ビデオを録画する必要がある」ことだと書いており、6月24日には v1.4 の動画撮影が始まったという投稿も流れていました(blockerRust Bytes)。Bun の 公式ブログ には、現時点では Zig→Rust 書き換えの詳細記事はまだ見当たりません。

周辺では、Rust移植版の unsafe の多さ、Miriでの未定義動作チェック、ElectrobunのBun依存解消なども話題になっていました(TheoIssue #30719Electrobun)。一方で、次のBunでは bun build --react-compiler が Rust で React Compiler を実行し、大規模ReactコードベースでBabelプラグインより19倍速いとも予告されています(Jarred Sumner)。

OCR / 文書解析

Baidu は Unlimited OCR をオープンソース化すると発表しました。長文書を一度に読むための3B total parameters / 500M activated のOCRモデルで、OmniDocBench v1.5/v1.6 で end-to-end SOTA とされています。論文は Unlimited OCR Works Welcome the Era of One-shot Long-horizon ParsingJerry Liu)。

Mistral OCR を ParseBench で比較した結果も流れていました。セマンティックフォーマット、読み順、幻覚、チャートなど、OCRモデルの比較軸が単純な文字認識から文書構造の再現へ移っています(Jerry Liu)。

Devtools系

Zed v1.8 がリリースされました。リリースノートは Stable ReleasesGitHub releases。新しい agent.terminal_init_command により、エージェントパネルで新しいターミナルスレッドを開くたびに指定コマンドを自動実行できます(Zed)。

Upstash Redis Search が GA になりました。公式ブログは Upstash Redis Search, Now Generally Available、ドキュメントは Search introduction。既存の strings、hashes、JSON に対して full-text search、filter、range、aggregation を使えるようにし、裏側では Rust の Tantivy を使っています(abdush)。

Redis 公式の FastAPI SDK も出ています。リポジトリは redis/fastapi-redis-sdk。FastAPI の dependency injection と Redis 接続管理、キャッシュを扱う統合です(FastAPI)。

Reanimated 4.5 では、React Native のCSS animationで :hover:active:focus の擬似セレクタを使えるようになりました。リリースは software-mansion/react-native-reanimatedSoftware Mansion)。

Figma は Config 2026 で Figma Motion を発表しました。Config 公式ページでは、Motion、depth、texture、code が canvas 上に入ると案内されています(Config 2026Figma release notes)。

Modular は Qualcomm による買収合意を発表しました。公式リリースは Business Wire の Qualcomm to Acquire Modular。AI compute layer を広いハードウェア上で最適化する文脈です(Modular)。

Claude Tag の権限

Claude Tag は、公式発表後も権限まわりの説明が流れています。公式発表は Anthropic の Introducing Claude Tag。Slack のチャンネル上で Claude をタグ付けして、作業を委任できる常駐エージェントです。

Claude が4人のいるチャンネルで作業するとき、誰の認証情報を使うのか、という説明が流れていました。答えは「Claude 自身の資格情報」で、チームメンバーの1人のようにプロビジョニングされる、という整理です。これは外部ツールやチャンネル上の権限の話で、課金はClaude Tag側の管理された実行に対する従量課金として別に考える必要があります(ClaudeDevs)。

その他の話題

OpenAI は GPT-5.5 Instant の新バージョンを出しました。OpenAI のページは GPT-5.5 Instant: smarter, clearer, and more personalizedModel Release Notes。質問の背後にある意図をよりよく理解し、応答を調整するようになったという説明です(OpenAI)。

Exa は、エージェントを公開Webの外側のデータに接続する Exa Connect を発表しました。ZoomInfo、Crunchbase、Similarweb などのデータプロバイダーに1つの Exa request からアクセスする方向です(Exa ConnectExa)。