AI開発者ニュース #4 Codex Reset、DeepSeek DSpark、OpenCode v2
AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。
これは有料購読者向けのボーナストラックコンテンツです。
AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。
形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。
今回は、Codex の利用制限リセットから入り、DeepSeek DSpark / DeepSpec、OpenRouter と Semgrep が示すオープンウェイトモデルの実利用、長い会話やモデルルーティングを扱う context engineering、Gemini Embedding の MRL、OpenCode / Tau / Walrus Memory などの AI エージェント開発基盤を見ます。後半では、DynamicLake、driver.js、devjar、Google AI Studio、npm staged publishing、Apple container 上の Kubernetes 実験といった devtools / 開発環境の話題も拾います。
Codex 利用制限のリセット
OpenAI の Tibo Sottiaux が、調査継続中のため Codex の利用制限を全員分リセットしたと説明していました。投稿では、利用制限を後から戻せる banked reset を複数回分ためていたユーザーがいたため、今回は個別の追加リセットではなく hard reset にした、と書かれています(Tibo)。
OpenAI Developer Community には、Codex の unexpected usage reset や quota period についてのスレッドも立っています(OpenAI Developer Community)。Codex changelog には、Plus / Pro ユーザー向けの rate-limit reset banking が追加されたことも載っています(Codex changelog)。
投稿では、Codex チームが日曜の war room でログを調べ、一部ユーザーに過剰な usage 消費を起こすものがないか確認していると書かれています。デスクトップアプリの最新バージョンで worktree mode が見当たらない、というユーザー報告も出ていました(Donny)。
DeepSeek DSpark / DeepSpec
DeepSeek が、V4 Flash / Pro 向けの speculative decoding 手法 DSpark と、学習・評価用コードベース DeepSpec を公開したという反応が流れていました。GitHub には deepseek-ai/DeepSpec と DSpark paper があります。
Daniel Han は、DSpark がスループットを 51% から 400% 改善し、Gemma や Qwen など他モデルにも使えると紹介していました(Daniel Han)。解説記事では、DeepSeek-V4-Pro-DSpark / Flash-DSpark は既存 V4 weight に draft module を付けたものだと説明されています(36Kr)。
オープンウェイトモデル
OpenRouter が、2026年6月時点で実際の agentic pipeline に入ってきたオープンウェイトモデルを整理する記事を出しました(The Open Weight Models that Matter: June 2026)。記事では DeepSeek V4 Flash、GLM 5.2 などが扱われています。
Semgrep は、IDOR 検出ベンチで GLM-5.2 が Claude Code を上回ったという記事を出しました。GLM-5.2 は F1 39%、Claude Code は 32%、1 finding あたり約 $0.17 とされています。ただし記事の結論は「モデル名だけでなく、どのコードを見せるか、finding をどうルーティングするか、どの harness で走らせるかが大きい」というものです(Semgrep)。
GLM-5.2 は Z.ai の Web chat と API、Hugging Face、GitHub から辿れます。ローカル実行側では、GLM 5.2 を Q2_K routed experts で量子化し、M5 Max 128GB 上で SSD streaming しながら動かす報告も出ていました(antirez)。
Context engineering
Nate Berkopec は、120K tokens 付近からモデルが鈍る例として、エージェントが失敗する直前に rewind し、compact して再実行すると改善する、と書いていました(Nate Berkopec)。Armin Ronacher も、長い会話は cache timeout 後に戻るとコストが大きくなると指摘しています(Armin Ronacher)。
Cursor の /multitask では、計画用に強いモデル、実行用に速いモデルへルーティングする使い方が紹介されていました。Coinbase が GLM 5.2 や Kimi 2.7 を LLM gateway の default に置き、ルーティングとキャッシュで AI 支出を下げている、という Brian Armstrong の発言も引用されています(Gergely Orosz、fredrika)。
Gemini Embedding と MRL
Gemini Embedding では、Matryoshka Representation Learning(MRL)によって、先頭側の次元だけを使っても性能低下を抑えやすいことが話題になっていました(ML_Bear)。MRL は、ベクトルの先頭に近い次元に重要な情報を入れ子状に凝縮して学習させる手法で、モデルを再学習することなく先頭から任意の次元数を切り出す(スライスする)だけで精度劣化を最小限に抑えた次元削減を行えます。Google の docs でも、gemini-embedding-001 と gemini-embedding-2 は MRL で学習され、出力次元を柔軟に選べると説明されています(Gemini API embeddings、Gemini Embedding 2)。
AIエージェント開発フレームワーク: OpenCode、Tau、Walrus Memory
OpenCode v2 では、TUI、Desktop、Web の各インスタンスが同じバックエンドを共有し、同期とリソース使用量を改善する方向が示されていました(dax)。opencode 実行時に TUI と server が起動し、TUI は server と通信する client として機能します(Server docs)。また、Vercel は AI SDK Harness に Deep Agents と OpenCode の adapter を追加し、HarnessAgent から複数の coding-agent runtime を同じ interface で呼び出せるようにしています(Vercel Developers)。
教育用プロジェクトとしては、Hugging Face のデベロッパーアドボケイトである Alejandro AO が、agent harness の作り方を学ぶためのミニマルな Python 製コーディングエージェント Tau を公開していました(Tau、Alejandro AO)。Mario Zechner は、Tau は基本的に Pi に近いが、教育目的でよりミニマルだと紹介しています(投稿)。関連して、Joel Hooks は Pi や Herdr などを題材にした durable loop の解説動画を公開し、agent loop の停止や人間による制御について扱っています(Building Durable Loops、joel)。
さらに、AIエージェントが実行する全アプリ間でコンテキストを持ち運べる、ポータブルなメモリレイヤー「Walrus Memory」も紹介されており、特定のプラットフォームへのロックインを避ける構成として注目されています(Walrus /acc)。
各種 Devtools・開発環境のアップデート
DynamicLake は、MacBook の notch を Dynamic Island 風の UI surface として使う macOS アプリです(Marcin Moskała)。同種の OSS には、MacBook notch を command surface にする Ebullioscopic/Atoll や jackson-storm/DynamicNotch があります。
Product tour 用の JavaScript ライブラリ driver.js は、週間ダウンロード数が 100万を超えたタイミングで refresh されました(Kamran Ahmed)。また、ブラウザの import maps を使ってエディタから Web サイトを直接ライブ編集するデモ devjar も公開されています(devjar、Jiachi)。
Google AI Studio では、作成したプロンプトやアプリからバリエーション(variant)を作成し、別の方向性のアイデアを比較・検証できる機能が追加されました(Logan Kilpatrick)。
パッケージ管理・リリース関連では、5月に GA になった npm の staged publishing について、GitHub Actions 上で Drydock と組み合わせてリリース前チェックを追加する試みが紹介されています(Jovi De Croock)。
Mac のローカル開発環境構築に関しては、Apple の container を使って Docker なしで macOS 上に開発用 Kubernetes cluster を作るツールが話題になっており、kind や minikube への適用について discussion が行われています(mazrean)。