Latest

AI開発者ニュース #5: Cursor iOS、Devin Fusion、Claude Code

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。 これは有料購読者向けのボーナストラックコンテンツです。 AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。 形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。 今回は、Cursor iOS、Devin Fusion / FrontierCode、Claude Code のサブエージェントを先に扱い、続いて X MCP、OpenClaw のモバイルアプリ、OpenCode v2、Cline の ClinePass、Vercel のボイスエージェント、Pi の Sidequest と /btw、Devtools 系を見ます。 Cursor iOS とクラウドエージェント Cursor が iOS 向けネイティブアプリを公開

AI開発者ニュース #4 Codex Reset、DeepSeek DSpark、OpenCode v2

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。 これは有料購読者向けのボーナストラックコンテンツです。 AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。 形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。

lock-1

作って使うAIエージェント —— Pi Coding Agentで足りない機能を自作しよう

Pi Coding Agentは、Mario Zechner氏が開発しているOSSのターミナル型コーディングエージェントです。 Pi Coding AgentA terminal-based coding agent なぜ今Piを紹介するのか。 コーディングエージェントは、Claude Code、Codex、Cursor、OpenCode、Hermes Agent、OpenClawなど選択肢が増えました。 一方で、関心はモデル単体の性能だけでなく、モデルをどう動かすかというハーネス層にも移っています。継続実行ループ、常駐ジョブ、サブエージェント、メモリ、検索、外部ツールをどう組み合わせるか、という話です。 この背景には、最高性能モデルのリリースが以前ほど単純ではなくなっていることもあります。OpenAIの次期モデルでは安全性確認を理由に段階的提供が報じられ、AnthropicのFable 5 / Mythos 5でも輸出管理に伴うアクセス制限が報じられました。 最先端モデルを待つだけではなく、自分用のハーネス環境を持ち、モデル、tool、memory、検索、実行ループを組

AI開発者ニュース #3 Codex Droplet、Notion Agents、AI SDK 7

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。 これは有料購読者向けのボーナストラックコンテンツです。 AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。 形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。 今回扱う話題は、Codex の DigitalOcean プラグイン、OpenAI 社内での Codex 利用、Notion に外部エージェントが参加する開発基盤、AI SDK 7、Vercel のエージェント向けデザイン標準、コーディングベンチマークでモデルがネットから答えを探す問題、Ornith-1.0 と LFM2.5-230M、Firecrawl の文書解析、Deno 2.9 などです。

lock-1

AI開発者ニュース #2: GLM-5.2、Agent skill、Bun Rust rewrite

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。 💡これは有料購読者向けのボーナストラックコンテンツです。 AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。 背景は昨日公開した Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。 今は実験的に全ユーザーへメール配信していますが、本運用では有料購読者のみへの配信に切り替える予定です。 今回扱う話題は、GLM-5.2 の Cursor / Devin 対応、GLM-5.2 の評価とRLインフラ、Agent skill の書き方、Gemini 3.5 Flash の Computer Use、Cursor と Notion 連携、Bun の Rust rewrite 進捗などです。

lock-1

Xのリコメンド資産から作る「AI開発者ニュース」を始めます

これまで、このブログや GitHub Sponsors の有料特典として何を提供するのがよいかを考えていました。 「応援してください」だけでは続きにくいですし、支援してくださる人にとっても、何が返ってくるのかが見えにくいです。 一方で、毎回大きな調査記事やベンチマーク記事だけを約束すると、個人で続けるには重くなりますし、そういうものは公開して広く読んでもらいたいと思っていました。 そこで、しばらく実験的に 「AI開発者ニュース 」というコンテンツを有料特典として始めてみます。 これは、実際に著者が毎朝やっている情報収集を少し外に出す試みです。 以前は、RSSフィード、Xのタイムライン、GitHub、公式ブログ、ニュースレターを一つひとつ手で開いて読んでいました。 最近は、その作業の一部を自作ツールとAIで自動化しています。 前日から当日にかけて流れてきた投稿や記事を集め、近い話題ごとにまとめ、あとで読むための短いメモにします。 なので、これは「ニュース記事を書く」というより、著者が自分用に作っている朝の情報収集メモを、有料読者にも読める形に整えるものです。 形式として

ts-bench v2: 数十万行規模のTypeScript製アプリの修正タスクでコーディングエージェントの性能を測る

筆者は以前よりts-benchというAIコーディングエージェントのベンチマークを作っています。 このたびv2に移行したので、その背景と設計、そして今後どう継続していくかを書きます。 GitHub - laiso/ts-bench: Benchmark CLI for comparing AI coding agents on TypeScript workloads.Benchmark CLI for comparing AI coding agents on TypeScript workloads. - laiso/ts-benchGitHublaiso なお、本記事に出てくるスコアやティアは2026年4月に試験的に回した一回分のスナップショットです。 最新ではないし、モデルやエージェント製品、評価コードが更新されれば順位は動きます。 「Opusには解けず、Sonnetには解けた課題があった」といった観測も、現時点では結論ではなく途中経過として読んでください ハーネスという用語の整理 この記事では、エージェントハーネスを、大規模言語モデル(LLM)にプロンプトを渡し、ツー

OpenClawブームのその後とHermes Agent

以前OpenClawの何が特別なのか?で、セルフホストできる「自分専用のパーソナルアシスタント」としてOpenClawを取り上げました。Mac miniなどの手元のマシンに住まわせて、TelegramやDiscordから話しかけると雑務をこなしてくれる、常駐型のエージェントです。指示がなくても定期的に自分から動くHEARTBEAT、会話やメモをMarkdownファイルとして手元に貯めていく記憶(メモリ)、再利用できる手順を持たせるAgent Skills。これらの仕組みを自分でいじって試す分には面白いが、安全に使うためのベストプラクティスはまだ定まっておらず過渡期にある、というのがそのときの筆者の評価でした。 OpenClawの何が特別なのか?ここ数日、OpenClawの名前をよく見かけたと思います。開発者がOpenAIに参加したニュースもあり、タイムラインで話題になっていました。 OpenClaw — Personal AI AssistantOpenClaw — The AI that actually does things. Your personal assistant o

『作って学ぶAIエージェント』を書きました ── TypeScriptでコーディングエージェントを自作する本

技術評論社のエンジニア選書から、新刊『作って学ぶAIエージェント ──TypeScriptとLLMで切り拓くAI時代のエンジニアリング』を出しました。2026年4月20日発売、紙版・電子版が同時に出ています。 作って学ぶAIエージェント | 技術評論社ソフトウェア開発の世界では「AIエージェント主導のコーディング」が主流になろうとしています。エージェントはコードを生成するだけでなく、ファイルを読み、コマンドを実行し、テストを実行し、結果を確認し、必要に応じて修正を繰り返します。 本書は、こうしたAIエージェントのしくみを「使う」のではなく「作る」ための実践的なガイドです。最終的にはGitHubのIssueを起点に、コードの修正からプルリクエストの作成までを自動化するコーディングエージェントを実装します。扱う技術はTypeScriptとBunを中心にし、GitHubへの統合までを扱います。 ここでは、エージェントの動作原理、つまり思考のしくみを自ら実装し、挙動の予測と制御、目的に合わせたカスタマイズを扱います。 実装するAIエージェントは、筆者が「Nano Code」と名付けたものです

AI時代のリッチテキスト形式(RTF)

Anthropic で Claude Code チームにいる Thariq Shihipar が、 2026年5月8日に「Using Claude Code: The Unreasonable Effectiveness of HTML」という記事を X に公開しました。 「HTML is the new Markdown」という宣言から始まる、AI の出力フォーマットとして Markdown ではなく HTML を活用するメリットを論じた内容です。 HTML is the new markdown. I've stopped writing markdown files for almost everything and switched to

Claude Codeの「ソースコード流出」をどう見るのか

3月31日の朝、Xのタイムラインが騒がしくなっていました。Claude Codeのソースコードが流出したというのです。調べてみると、npmパッケージ(v2.1.88)にデバッグ用のsource mapファイル(cli.js.map)が含まれた状態でリリースされていました。source mapのsourcesContentフィールドに元のTypeScriptソースコード全体がそのまま埋め込まれており、発見者の投稿は数千万ビューを記録。GitHubにミラーリングされ数万フォークされる事態になりました。 Claude code source code has been leaked via a map file in their npm registry! Code: https://t.co/jBiMoOzt8G pic.twitter.com/rYo5hbvEj8 — Chaofan Shou (@Fried_rice) March 31, 2026

コーディングエージェント向けのリモートサンドボックス

コーディングエージェントの普及にともない、エージェントをリモートで動作させるための専用開発環境——リモートサンドボックスが注目されています。ここでいうサンドボックスとは、プロジェクトやエージェントごとに気軽に生成・破棄できるリモートVMのことで、exe.dev、Sprites、Docker Sandbox などのサービス・ツールが登場しています。 本記事ではこれらのリモートサンドボックスの用途を整理し、exe.dev・Sprites・Docker Sandboxの3つを比較します。 なぜ専用の開発環境が必要なのか コーディングエージェントをリモートで走らせる環境として、これまで一般的だった選択肢を列挙すると以下のようになります。 * Mac miniやRaspberry Piを買って自宅サーバーを立てる * VPS(Hetzner、さくらVPSなど)を契約する * Devin、Claude Code on the web、Codex(Cloud)などのマネージドサービスを使う * GitHub Codespaces、Gitpodなどのクラウド開発環境を使う これらの

Claude CodeにOpenAIのサイトを読んでもらうには?

OpenAIのサイトが読めない問題 Claude Codeで作業をしていると、OpenAIのサイトを参照したい場面があります。最新のニュースを確認したい、ブログ記事を読みたい、そんなときにClaude Codeに「read https://openai.com/ja-JP/news/」と頼むと、こうなります。 ❯ read https://openai.com/ja-JP/news/ ⏺ Fetch(https://openai.com/ja-JP/news/) ⎿ Error: Request failed with status code 403 ⏺ 申し訳ありませんが、https://openai.com/ja-JP/news/ へのアクセスが 403 (Forbidden) で拒否されました。このサイトはボットやスクレイピング

Codex CLIのsubagentsを使って並列コードレビューを試す

Codex CLIで正式にsubagentsが使えるようになったので、実際のPRレビューで試してみました。 題材は拙作site2skill PR #7で、実装をPythonからRustへ完全書き換えたブランチで、56ファイル変更、diff 9185行のPRです。このPRは新興モデルのQwen3.5+Qwen Codeで生成したもので、指摘すべきアラが多いと想定して選びました。 筆者の環境はgpt-5.4(reasoning medium)の無料プランで、計測とログ分析はClaude Codeで行いました。 subagentsとは Codex CLIが並列でエージェントをspawnしてタスクを分担する機能です。~/.codex/agents/にTOMLファイルを置くとカスタムエージェントを定義できます。 Subagents – Codex | OpenAI DevelopersUse subagents and custom agents in CodexOpenAI Developers 内部の動きはセッションログ(~/.codex/sessions/以下のJSONL形式

OpenClawの何が特別なのか?

ここ数日、OpenClawの名前をよく見かけたと思います。開発者がOpenAIに参加したニュースもあり、タイムラインで話題になっていました。 OpenClaw — Personal AI AssistantOpenClaw — The AI that actually does things. Your personal assistant on any platform.jonahships_ OpenClawはオープンソースの自律型AIエージェントで、LLMに自分のPCの強い権限を渡してAgent Skillsの仕組みで自動操縦します。いわば、Devinのような自律型アシスタントを個人が安価にセルフホストできるようになったものです。Claude Code(非OSS)やCodex CLIといったコーディングエージェントより一段上のレイヤーにあたります。Claude Codeでも同等のことは実現できますが、常時起動・チャット連携・スキル管理といったハーネスを自前で組む必要があり、OpenClawはそこをまるごと引き受けて定期的に推論してツール実行まで走ります。セキュリティ面がまだ未

Claude Code Agent Teamsのあそびかた

Agent Teamsは2026年2月5日にOpus 4.6と同時リリースされた実験的機能で、Claude CodeのSubagentsを独立プロセス化し、双方向にメッセージングできるようにする仕組みです。 Orchestrate teams of Claude Code sessions - Claude Code DocsCoordinate multiple Claude Code instances working together as a team, with shared tasks, inter-agent messaging, and centralized management.Claude Code Docs 一言でいうとSubagentsを拡張してステートフルにした機能です。各エージェントが自分のインボックス(~/.claude/teams/配下のJSONファイル)をポーリングしていて、メールボックスのアナロジーで相互通信が実現されています。ファイルロックで排他制御しているので、推論+ファイルシステムだけでメッセージングシステムが成立しているのが面白いところ

私のソフトウェア開発を一変させてしまった2025年のAIエージェントをふりかえる

2023年から段階的にAIを開発フローに組み込み、2025年は試行錯誤とツールの大きな変化、そしてエージェント化を経て、私のソフトウェア開発の進め方は明確に変化しました。 ここで言う「変化」とは、単に作業が速くなった、便利になったという話ではありません。 より具体的には「コードをタイピングする時間よりも、間接作業の比重と抽象的な思考・ロジックが増えた」という意味での変化です。 とりわけ深刻なのは文字入力回数の増大です。その結果、マイクに向かって話したり、タイピングの練習といったプリミティブな活動を取り入れるようになりました。 この変化は私だけのものではありません。Addy Osmaniは『Beyond Vibe Coding』で「開発者の役割はコードを書くことから、コードを指示すること(directing)へシフトしている」と述べ、アーキテクチャやデザインパターンといったシステム思考への集中を説いています。Latent SpaceのSwyxも「ソフトウェアエンジニアの強みは抽象化のレベルを上げることに最も長けている点だ」と指摘しています。 この流れに対して「コーディングがつまらな

Claude CodeにLSPツールが追加

数ヶ月前の「Serena MCPはClaude Codeを救うのか?」で「Claude Code本体にLanguageServer統合を追加する可能性も考えられます」と書きましたが、その機能が2.0.74で有効になりました。 導入方法は「Claude Code の LSP サポート」が詳しいので参照ください。 Claude Code の LSP サポートClaude Code のバージョン 2.0.74 から LSP(Language Server Protocol)サポートが追加されました。LSP サポートにより、Claude Code はコードベースに対してシンボルの定義検索、参照検索、ホバー情報の取得などの操作が可能になります。この記事では Claude Code の LSP サポートの概要と使用方法を紹介します。azukiazusaのテックブログ2 まとめると/plugin

site2skill: どんなサイトでもClaude Skills化するツールを作った

任意のWebドキュメントをClaude Agent Skills化するツール site2skill を作りました。PAY.JPのドキュメントを例に、Claude Codeがドキュメントを参照しながら開発する流れを説明します。 GitHub - laiso/site2skillContribute to laiso/site2skill development by creating an account on GitHub.GitHublaiso LLMが知らないライブラリを使うとき LLMには知識のカットオフ(学習データの期限)があります。新しいライブラリやマイナーなAPIを使おうとすると、LLMは正確な情報を持っていません。例えばClaude Opus 4.5 の知識は2025年8月のものであり、それ以降にリリースされたライブラリや、学習データに含まれていないドキュメントについては、正確なコードを生成できません。 こういう場面では、Webのドキュメントを要約してチャットに貼り付け、それをもとに実装してもらうという作業を繰り返すことになります。この方法は有効ですが、毎回ドキ

MoonBitの新AI エージェント実装「Maria」

この記事は MoonBit Advent Calendar 2025 13日目の記事です。 Moonbit - Qiita Advent Calendar 2025 - QiitaCalendar page for Qiita Advent Calendar 2025 regarding Moonbit.Qiita MoonBit Maria(以下、Maria)は、MoonBit公式の AI エージェントなプロジェクトです。GitHub リポジトリで公開されています。MoonBitのasyncベースで実装されています。 GitHub - moonbitlang/maria: moon agent rewritten in asyncmoon agent rewritten in async. Contribute to moonbitlang/maria development by

Anthropic Sandbox Runtime (srt)と次世代のAIエージェントのアーキテクチャ

Anthropic Sandbox Runtime (srt) は、Claude Code on the web などクラウド環境向けに Anthropic が開発した軽量サンドボックスの PoC(概念実証)です。 Making Claude Code more secure and autonomous with sandboxingLearn how Claude Code’s new sandboxing feature protects developers with filesystem and network isolation, reducing permission prompts and increasing user safety. 少なくない Claude Code ユーザーは

lock-1

Codex CLI が Skills をサポート

Codex CLI の最新版v0.65.0 において、experimental ではありますが Skills のサポートが導入されました[1]。 codex/docs/skills.md at main · openai/codexLightweight coding agent that runs in your terminal - openai/codexGitHubopenai [1]: https://github.com/openai/codex/pull/7412 Claude Skills と同じ形式のディレクトリを配置するだけで読み込まれるため、導入の手間はほとんどありません。設定としては、config.toml に次の一行を追加します。 [features] skills = true スキルパッケージは ~/.codex/skills

Gemini 3 Proはデザインに強いのか?

Gemini 3 ProとClaude Opus 4.5のリリースが近かったこともあり、世間ではこの2つのモデルの性能比較が盛んに行われていました。中でもクリエイターたちの意見で目立ったのは、「Gemini 3 Proの方がOpus 4.5よりもUIデザインが得意だ」というものでした[1]。 [1]: Design Arena で4部門でトップ、Xランドでの言及も多い。 少なくともGemini 2.5 Pro以前は、UIデザインの評判はClaude Sonnetの独壇場だったはずです。v0やBoltといった多くのサイト作成サービスにSonnetが採用されていることからも、それは明らかです。 ではGemini 3 Proの登場で状況は変わったのか? というのを自分で確かめてみることにしたのが本記事の趣旨です。 なおここで作成したウェブサイトはVercelにデプロイしています。各モデルが生成したUIを以下から実際にブラウザで確認できます。 https://lp-compe.vercel.app/ 結論から言うと、UI再現タスクでは Claude Opus 4.5 が最も高精度かつ