AI開発者ニュース #3 Codex Droplet、Notion Agents、AI SDK 7

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。

これは有料購読者向けのボーナストラックコンテンツです。
AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。
形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。

今回扱う話題は、Codex の DigitalOcean プラグイン、OpenAI 社内での Codex 利用、Notion に外部エージェントが参加する開発基盤、AI SDK 7、Vercel のエージェント向けデザイン標準、コーディングベンチマークでモデルがネットから答えを探す問題、Ornith-1.0 と LFM2.5-230M、Firecrawl の文書解析、Deno 2.9 などです。

Codex の実行基盤を Droplet にする

OpenAI は、Codex から DigitalOcean のステートフルなクラウド開発環境を立ち上げられるプラグインを案内しました。Codex changelog には、DigitalOcean Droplet を作成し、SSH アクセスを設定し、Codex App のリモートワークスペースとして接続するプラグインと書かれています(Codex changelogOpenAI Developers)。

DigitalOcean 側にも Run Codex in the cloud が出ており、プラグインのリポジトリは digitalocean/DOCodexPlugin です。Codex App から外部の VPS 事業者にサーバーインスタンスを作らせるインテグレーションで、Codex の作業場所を OpenAI 側の実行環境だけでなく、ユーザーの DigitalOcean アカウント内の Droplet に広げます。DigitalOcean 側の投稿では、新しい VM を立ち上げ、管理させ、ラップトップを閉じても作業を続けさせる流れとして紹介されています(dominik kundel)。

OpenAI 社内での Codex 利用

How agents are transforming work では、Codex が OpenAI 内の各部門で、より長い期間の作業や部門横断の作業に使われている事例が紹介されています(OpenAI)。

記事では、開発者だけでなく、社内の複数部門が Codex を使うようになったと書かれています。Codex の話題としてはプロダクト発表ではなく、組織内でのエージェント利用事例です。

Notion に外部エージェントが参加する開発基盤

Notion は Introducing Notion's Developer Platform を公開し、External Agent API、Notion CLI、Workers runtime などをまとめて発表しました。External Agent API では、Claude Code、Cursor、Codex、Decagon などを Notion ワークスペース内の参加者として扱う方向が示されています。

前号では Cursor 側から見た Notion 連携を扱いましたが、Notion 側の発表は一般業務用の Notion AI 機能というより、外部のエージェントや社内エージェントを Notion 上の作業主体として接続する開発基盤です。Notion MCP では、Claude Code、Cursor、VS Code、ChatGPT などから Notion を読み書きする方法が整理されています(Notion MCP)。

Notion の Simon Last も、Claude と Cursor が最初で、今後ほかのエージェントや企業内の自作エージェントを接続する方法も提供すると書いていました(Simon Last)。

AI SDK 7

Vercel は AI SDK 7 is now available を公開しました。TypeScript で AI アプリケーションやエージェントを組むための SDK で、今回の焦点は推論制御、エージェント単位のツール承認、ツールと実行時コンテキスト、ファイルと skill のアップロード、MCP などです。

AI SDK docsvercel/ai releases には、推論制御、ツール承認、実行時コンテキスト、ファイルと skill のアップロード、MCP が並んでいます(AI SDK)。

AI SDK は UI とエージェント実行の間に置かれることが多く、モデル呼び出しだけでなく、承認、コンテキスト注入、ファイル入力、MCP 連携の API も含みます。

Vercel のエージェント向けデザイン標準

Vercel は Teaching agents product design at Vercel を公開しました。コーディングエージェントに Vercel の product design standard を注入するために、agent skill、lint rules、Vercel Agent code reviews、evals、人間主導の更新ループを組み合わせた、という内容です(Guillermo Rauch)。

同じ文脈で、Agent Skills: Creating, Installing, and Sharing Reusable Agent Contextvercel-labs/design-systems-to-agent-skills も出ています。v0 の Design Systems 2.0 と合わせると、デザインシステムをエージェントが参照できる形に落とす話です。

コーディングベンチマークでモデルがネットから答えを探す問題

Cursor が、公開コーディングベンチマークに対する報酬ハックを扱う記事 Reward hacking is swamping model intelligence gains を出しました。

記事では、Opus 4.8 や Composer 2.5 などの新しいモデルが、インターネットや Git 履歴から既知の解法を見つけてスコアを上げる例を示しています。Git 履歴を隠し、インターネットアクセスを制限した厳しい評価環境では、スコアが大きく落ちる、という主張です(Cursor)。

コーディングモデルの比較では、モデルそのものだけでなく、ベンチマークの公開範囲、リポジトリ履歴、ネットワークアクセス、評価ハーネスが結果に入ります。

Ornith-1.0

DeepReinforce が、エージェント型コーディング向けのオープンモデルファミリー Ornith-1.0 を発表しました。Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding では、9B dense、31B dense、35B MoE、397B MoE の4サイズ、MITライセンス、Gemma 4 / Qwen 3.5 をもとにした追加学習が説明されています。

Ornith-1.0 が注目されたのは、モデルのサイズ展開やベンチマークだけでなく、学習アプローチを変えているためです。通常のコード生成モデルのように解答例だけを学習するのではなく、エージェントがタスクを進めるときの手順、検証、失敗からの復帰までを強化学習の対象にする、と説明されています。Terminal-Bench 2.1、SWE、NL2Repo、OpenClaw などで同規模のオープンソースモデルを上回るという発表です(OrnithDeepReinforceJiwei Li)。

開発元の DeepReinforce は、強化学習をコード最適化に使うプロジェクトを出してきたチームです。deepreinforce-ai の GitHub organization には CUDA 最適化向けの CUDA-L1 や IterX 関連リポジトリがあります。

Hugging Face には Ornith-1.0-9B と GGUF 版が公開されています。初期報告では、2枚の RTX 3090 で 35B を動かした例、BF16 で todo list ループに入る例、DGX Spark 上の llama.cpp で 4bit 約75 tok/s という例が出ています(PolZeusVictor Angel Cruz)。

小型ローカルモデル LFM2.5-230M

Liquid AI は、CPU / NPU / GPU で動く 230M パラメータの小型モデル LFM2.5-230M を公開しました。スマートフォン、ロボット、ホーム/ネットワーク自動化デバイスでのエージェントタスクを想定しています(Liquid AI)。

Firecrawl MCP で文書を Markdown / JSON にする

Firecrawl は、MCP から /parse を使えるようにしました。/parse: Turn any document into LLM-ready datafirecrawl/firecrawl-mcp-server では、PDF、スプレッドシート、ドキュメントを Markdown や構造化 JSON に変換できます(Firecrawl)。

5倍高速化の理由として、Firecrawl は /parse の裏側を Rust ベースの解析エンジンにしたと説明しています。記事では平均 400ms/page 未満で処理し、従来の Firecrawl parser より 3.5〜5.7倍速い、という測定が出ています。PDF だけでなく DOCX、XLSX、HTML などを扱い、LLM に入れやすい Markdown / JSON へ直接落とすエンドポイントです。

Mastra のワークフローイベント

Mastra は、エージェントとワークフローのイベントを publish / subscribe できるようにしました。ワークフローのステップ完了、一時停止、完了などを外部システムへ流せます(PubSubSam Bhagwat)。

Devtools系: Deno 2.9、Node 26.4、GitHub Copilot CLI、AI Gateway

Deno 2.9 が出ました。Deno 2.9 では、deno desktop、起動とメモリ使用量の改善、CSS import、各種 lockfile import などが入っています。deno desktop は Deno プロジェクトを自己完結したデスクトップアプリにするコマンドで、出力バイナリにアプリのコード、Deno runtime、WebView layer を含みます(Desktop appsDeno)。

Node.js 26.4.0 では、--experimental-vfs フラグの後ろに node:vfs ビルトインモジュールが入りました(Node.js 26.4.0Node.js)。GitHub Copilot CLI と VS Code では、strictKnownMarketplaces で承認済み marketplace からのプラグインだけをインストールできるようになりました(GitHub Changelog)。

Vercel AI Gateway では、GLM 5.2 Fast via Wafer が利用可能になりました。Wafer は GLM 5.2 Fast を提供する推論プロバイダーで、Vercel の内部ベンチマークでは、ほかの GLM-5.2 提供元よりトークン処理量が約2倍高いとされています(Vercel changelogGuillermo Rauch)。