Sign in Subscribe

Archive

A collection of 62 issues

Featured

私のソフトウェア開発を一変させてしまった2025年のAIエージェントをふりかえる

2023年から段階的にAIを開発フローに組み込み、2025年は試行錯誤とツールの大きな変化、そしてエージェント化を経て、私のソフトウェア開発の進め方は明確に変化しました。ここで言う「変化」とは、単に作業が速くなった、便利になったという話ではありません。より具体的には「コードをタイピングする時間よりも、間接作業の比重と抽象的な思考・ロジックが増えた」という意味での変化です。とりわけ深刻なのは文字入力回数の増大です。その結果、マイクに向かって話したり、タイピングの練習といったプリミティブな活動を取り入れるようになりました。この変化は私だけのものではありません。Addy Osmaniは『Beyond Vibe Coding』で「開発者の役割はコードを書くことから、コードを指示すること（directing）へシフトしている」と述べ、アーキテクチャやデザインパターンといったシステム思考への集中を説いています。Latent SpaceのSwyxも「ソフトウェアエンジニアの強みは抽象化のレベルを上げることに最も長けている点だ」と指摘しています。この流れに対して「コーディングがつまらな

Claude CodeにLSPツールが追加

数ヶ月前の「Serena MCPはClaude Codeを救うのか？」で「Claude Code本体にLanguageServer統合を追加する可能性も考えられます」と書きましたが、その機能が2.0.74で有効になりました。導入方法は「Claude Code の LSP サポート」が詳しいので参照ください。 Claude Code の LSP サポートClaude Code のバージョン 2.0.74 から LSP（Language Server Protocol）サポートが追加されました。LSP サポートにより、Claude Code はコードベースに対してシンボルの定義検索、参照検索、ホバー情報の取得などの操作が可能になります。この記事では Claude Code の LSP サポートの概要と使用方法を紹介します。azukiazusaのテックブログ2 まとめると/plugin

site2skill: どんなサイトでもClaude Skills化するツールを作った

任意のWebドキュメントをClaude Agent Skills化するツール site2skill を作りました。PAY.JPのドキュメントを例に、Claude Codeがドキュメントを参照しながら開発する流れを説明します。 GitHub - laiso/site2skillContribute to laiso/site2skill development by creating an account on GitHub.GitHublaiso LLMが知らないライブラリを使うとき LLMには知識のカットオフ（学習データの期限）があります。新しいライブラリやマイナーなAPIを使おうとすると、LLMは正確な情報を持っていません。例えばClaude Opus 4.5 の知識は2025年8月のものであり、それ以降にリリースされたライブラリや、学習データに含まれていないドキュメントについては、正確なコードを生成できません。こういう場面では、Webのドキュメントを要約してチャットに貼り付け、それをもとに実装してもらうという作業を繰り返すことになります。この方法は有効ですが、毎回ドキ

Codex CLI が Skills をサポート

Codex CLI の最新版v0.65.0 において、experimental ではありますが Skills のサポートが導入されました[1]。 codex/docs/skills.md at main · openai/codexLightweight coding agent that runs in your terminal - openai/codexGitHubopenai [1]: https://github.com/openai/codex/pull/7412 Claude Skills と同じ形式のディレクトリを配置するだけで読み込まれるため、導入の手間はほとんどありません。設定としては、config.toml に次の一行を追加します。 [features] skills = true スキルパッケージは ~/.codex/

Gemini 3 Proはデザインに強いのか？

Gemini 3 ProとClaude Opus 4.5のリリースが近かったこともあり、世間ではこの2つのモデルの性能比較が盛んに行われていました。中でもクリエイターたちの意見で目立ったのは、「Gemini 3 Proの方がOpus 4.5よりもUIデザインが得意だ」というものでした[1]。 [1]: Design Arena で4部門でトップ、Xランドでの言及も多い。少なくともGemini 2.5 Pro以前は、UIデザインの評判はClaude Sonnetの独壇場だったはずです。v0やBoltといった多くのサイト作成サービスにSonnetが採用されていることからも、それは明らかです。ではGemini 3 Proの登場で状況は変わったのか？というのを自分で確かめてみることにしたのが本記事の趣旨です。なおここで作成したウェブサイトはVercelにデプロイしています。各モデルが生成したUIを以下から実際にブラウザで確認できます。 https://lp-compe.vercel.app/ 結論から言うと、UI再現タスクでは Claude Opus 4.5 が最も高精度かつ

Latest

Grok 4がリリース

xAIのGrok 4が公開されました。 Introducing Grok 4, the world's most powerful AI model. Watch the livestream now: https://t.co/59iDX5s2ck — xAI (@xai) July 10, 2025 モデルカードコンテキストウィンドウは256,000トークンです。Claude 4 Sonnetが200,000トークン。 Models / Grok 4 「Grok 4 Code」って何なのコーディングモデルの名前です。Claude Code的なCLIではなさそうです。OpenAIでいうCodex（モデルの方）になります。Redditのスレによると「Cursorで使える」というメッセージがコンソールにでていたらしいです。 Grok

Devin vs Cursor Background Agents: 完全自律型AIエージェントの性能比較

はじめに Cursor のBackground Agentsが無事BETA Preview になったので「Devinとどの程度たたかえるのか？」という疑問が湧いてきました。そこでTypeScriptのクイズ101問をすべて解くというタスクでDevinと戦ってもらいます。ここにスーパーサブのClaude Code Actionさんも参加してもらって三つ巴にします。チャンピオンを決めようや・・・お題はexercism/typescriptのリポジトリを筆者がエージェントタスク向けにフォークしたものを使います。Exercismはプログラミング学習サイトで、GitHubで公開している問題集とテストコードはAider PolyglotやRoo Codeなど実際のエージェント製品のベンチマークで使用されており、エージェント同士の比較に適しています。 GitHub - laiso/exercism-typescript: Exercism exercises in TypeScript.Exercism exercises in TypeScript. Contribute to lais

Cursorの価格設定変更の騒動について

2025年6月にCursorは価格体系を大幅に変更し、月額20ドルのProプランを「リクエスト数制限」から「トークン使用量制限」へと切り替え、さらに月額200ドルのUltraプランを新設しました。 Updates to Ultra and Pro | Cursor - The AI Code EditorIn collaboration with the model providers, we’re introducing a $200 / mo tier for power users.Cursor Cursorの説明によると、以前は月500リクエストまでの制限で、リクエストごとのトークン使用量は考慮されていませんでした。新しい料金モデルは1回のリクエストで消費するトークン数が大幅に異なるため、単純なリクエスト数制限ではコストを正確に反映できなくなりました。そのため、CursorはAPIベースのトークン使用量課金に移行し、Proプランには月20ドル分のトークンクレジットを含み、それを超えた分は追加課金となる形にしました。まずいことにCursorはこの変更をポジティブに伝えるた

t-wada vs テスト大好郎

先日一部のClaude Codeユーザーの間で「プロンプトに”t-wadaさんの推奨する進め方に従ってください”と書くとテスト駆動開発のプラクティスを実践してくれる」というTIPSが話題になっていました。なるほど、TDDやテスト駆動開発という言葉は広まりすぎて「意味の希薄化」が発生し、曖昧な理解のまま自動テストやテストファーストと混同され、それがLLMの学習データにも影響したが、人名を与えるとLLMに「具体的な参照点」を与え、より具体的なプログラミングスタイルに限定させる効果があったのか pic.twitter.com/p6SCPj8YdA — Takuto Wada (@t_wada) June 25, 2025 これは確かに面白い現象で、現にClaudeに直接質問するとt-wadaさんの知識を持っていることがわかります。そこから連想してClaude CodeがTDDをするトリガーとして使えるのなら面白いなと思い色々試してみました。（ところでこの翌日、最近バイブコーディングにはまってSmalltalkのライブラリをLLMで書いているKent Beckも自著のタイトルを

Claude CodeのHooksでタスク完了メッセージをデスクトップ通知する

Claude CodeではNotificationでベル音を鳴らすことができますが、私は音量をゼロにしてMacを使っているため、デスクトップのバナー通知で視覚的に知らせてほしいと思っていました。一部のユーザーは、osascriptやterminal-notifierのコマンド呼び出し指示を各自CLAUD.mdに記載してこれを実現させているようですが、毎回推論コンテキストに載せるに抵抗があり、そこまでは手を出せていませんでした。しか昨日リリースされたHooks機能は、まさにこの用途に最適でした。ドキュメントにもカスタム通知を設定する例が載っています。 Hooks - AnthropicCustomize and extend Claude Code’s behavior by registering shell commandsAnthropic すでにHooksのさまざまなユースケースが公開されていて、例えばファイルのフォーマッタやSlack・LINEへの通知などを行っているユーザーがいます。 Claude Code の Hooks で作業が終わった後にフォーマッターを実行

Claude CodeのTaskツールの並列実行（parallelTasksCount）は分析タスク向け

Claude CodeのTaskツールは派生元となる親エージェントの処理から子エージェントがメッセージAPI呼び出しを非同期で実行しているが、この時の子の数がparallelTasksCountの設定値になる。デフォルトでは「１」に設定されている。これを上書きするコマンドは以下になる。設定値を上げるとトークン消費量が増加するので注意してほしい。 claude config set -g parallelTasksCount 2 parallelTasksCountはTaskツール実行時の動作を変える。簡単なテスト方法はClaude CodeにTaskツールを使ってくれと直接頼むことだ。parallelTasksCountの数だけ「Initializing N parallel agents…」がコンソールに出力される。 Tyler Burnamのポストではこの並列数がタスク完了速度に寄与するという説明をしているが、筆者が調べたところによるとそれは正確でなかった。 Taskツールの並列実行は親となるエージェント・内部的にはSynthesis Agentと呼ばれる、が子に対して

Roo CodeをIPCで外部から操作する

Roo CodeのIPCシステムについて Roo CodeのIPCシステムは、VS Code拡張機能と外部プログラム間でリアルタイム通信を実現するクライアント・サーバーアーキテクチャです。外部プログラムからRoo Codeを自動制御し、エージェントレベルの評価システムやテスト自動化などに活用できます。Roo Code開発チームはこのIPCシステムを活用して、エージェントレベルのEvals（評価）システムを構築しています。 Roo Code EvalsQuantitative evals of LLM coding skills.Roo Code このIPCシステムは、ホストマシン上のRoo Code拡張がUnixドメインソケットを使用してIPCサーバーを起動し、クライアント側の外部プログラムがNode.jsのnode-ipcライブラリを使用してサーバーに接続する構成となっています。通信方式はEventEmitterベースの双方向非同期メッセージングを採用しており、すべてのデータはzodで構造化されたJSON形式でコマンドとイベントのやり取りが行われます。メッセージングプロトコ

Gemini CLIがリリース

かねてから噂されていたGoogleのGemini公式のCLI型コーディングエージェント「Gemini CLI」がリリースされました。Gemini CLIはClaude Codeのようにターミナル（CLI）から使えるツールです。モデルは標準でGemini 2.5 Proが無料で使え、WindowsでもWSLなしに動作します。 GitHub - google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal.An open-source AI agent that brings the power of Gemini directly into your terminal. - google-gemini/gemini-cliGitHubgoogle-gemini Gemini

2025年度のOSSプロジェクトへの寄付とスポンサー募集のお知らせ

筆者は個人が中心に開発しているOSSプロジェクトへの寄付を行なっております。このリストを毎年見直しており、２０２５年のポートフォリオの更新を今回行いました。継続が重要と考えているので、これらはOSSが提供され続ける限り無期限で行う予定です。現在のプロジェクトのリストはこちらです aquaskk GitHub - codefirst/aquaskk: An input method without morphological analysis.An input method without morphological analysis. Contribute to codefirst/aquaskk development by creating an account on GitHub.GitHubcodefirst メンテナのbanjunさん宛 azooKey azooKeyオープンソースの日本語入力システム「azooKey」. azooKey has 14 repositories available. Follow their code on GitHub.

Xcode 26のCodingAssistantを試した

WWDC 2025でXcodeにChatGPTが統合されて自然言語で指示するとSwift書いてくれるというアナウンスがあったので使ってみました。内部の設定ファイルにCodingAssistantという名前がついていたのでそう呼びます。 Writing code with intelligence in Xcode | Apple Developer DocumentationGenerate code, fix bugs fast, and learn as you go with intelligence built directly into Xcode.Apple Developer Documentation 前提条件 Xcode 26を使うために、macOS 26 betaにあげる必要があります。 Xcode 26 beta (17A5241e) - Releases - Apple DeveloperView downloadsView release notesApple Developer 利用イメージ