AI開発者ニュース #6: Claude Sonnet 5、Fable 5、Gemini Omni Flash

AI開発、コーディングエージェント、devtools 周辺で読んでおきたい話題をまとめます。

これは有料購読者向けのボーナストラックコンテンツです。 AI開発、コーディングエージェント、devtools 周辺の話題を、一次情報を辿れる形で短くまとめます。 形式や背景は、Xのリコメンド資産から作る「AI開発者ニュース」を始めます に書きました。

今回は、Claude Sonnet 5 と Fable 5 / Mythos 5 の輸出規制解除を先に扱い、続いて Claude Desktop for Linux、Cursor での Sonnet 5 対応、Google の Gemini Omni Flash / Nano Banana 2 Lite、NotebookLM の Short Video Overviews、Pi と Claude Agent SDK、Devtools 系を見ます。

Claude Sonnet 5

Anthropic は 6 月 30 日、エージェント性能を前面に出した中位モデル Claude Sonnet 5 を公開しました(Claude)。計画立案、ブラウザやターミナルなどのツール利用、長時間の自律実行を、数ヶ月前にはより大きく高価なモデルが必要だった水準まで引き上げた、という位置づけです。

Free / Pro の既定モデルになり、Max / Team / Enterprise、Claude Code、Claude Platform でも使えます。API 名は claude-sonnet-5 で、8 月 31 日まで入門価格 $2 / $10 per MTok、その後は $3 / $15 です(Introducing Claude Sonnet 5What's new in Claude Sonnet 5)。1M トークン context、128k max output、adaptive thinking 既定 ON、manual extended thinking と非既定の sampling パラメータは 400 エラーになります。Priority Tier は Sonnet 5 では使えません。

Claude Sonnet 5 System Card では、Mythos 5 よりサイバー能力が低く、米政府の Autonomy threat model 1 でも一般提供に留まる、と説明されています。サイバーセーフガードは Opus 4.7 / 4.8 と同系統で、Fable 5 ほど広くはブロックしません。

新トークナイザーにより、同じテキストでも Sonnet 4.6 比でおおよそ 30% 多くのトークンになります(release notes)。Simon Willison は Claude Token Counter で英語約 1.4 倍、スペイン語約 1.33 倍、簡体字中国語はほぼ同額、Python コードは約 1.27 倍と測っています。入門価格は移行コストをほぼ中立にする設定ですが、8 月以降は実トークン数の再計測が必要です。

Cursor は同日、Sonnet 5 を統合し、社内ベンチ CursorBench では Sonnet 4.6 の 49% から 57% へ上がったと報告しています(Cursor)。

Fable 5 と Mythos 5 の輸出規制解除

米商務省は 6 月 30 日、Fable 5 と Mythos 5 の輸出規制を解除したと Anthropic が発表しました(AnthropicRedeploying Fable 5)。Fable 5 は 7 月 1 日から全世界で復帰します。Pro / Max / Team / 一部 Enterprise では 7 月 7 日まで週次利用制限の最大 50% を Fable 5 に充て、その後は usage credits 経由です(Theo)。

再展開にあたり新しい分類器セットを入れ、サイバーセキュリティタスクのブロック範囲を広げています。ルーチンなコーディングやデバッグの一部は Opus 4.8 へフォールバックする、と Anthropic は書いています。Thariq 氏は、元の分類器と同様に少数のルーチンタスクだけがフラグされる、と補足しました(Thariq)。Glasswing 向け jailbreak 評価フレームワーク案や政府連携の詳細は Redeploying Fable 5 にまとまっています。

Claude Desktop for Linux

Boris Cherny 氏は、Ubuntu 22.04+ と Debian 12+ 向けに Claude Desktop for Linux の beta を案内しました(Boris Cherny)。Chat、Cowork、Claude Code を macOS / Windows と同じデスクトップ体験で使えます。Anthropic の apt リポジトリから claude-desktop を入れ、通常の apt upgrade で更新します。

Linux beta では Computer Use、デスクトップアプリ内の音声入力、Fedora / RHEL 公式サポートはまだありません。Quick Entry のグローバルホットキーは X11 では動き、ネイティブ Wayland では GlobalShortcuts portal が必要です(desktop-linux docs)。

Gemini Omni Flash と Nano Banana 2 Lite

Google は 6 月 30 日、生成メディア向けに Nano Banana 2 Lite と Gemini Omni Flash を Gemini API、AI Studio、Gemini Enterprise Agent Platform へ出しました(blogLogan KilpatrickGoogle AI Studio)。

Nano Banana 2 Litegemini-3.1-flash-lite-image)はスループット重視の画像モデルで、1K 画像を約 4 秒、$0.034 / 1K image です。レガシー gemini-2.5-flash-image の置き換え先として推奨されています(image generation docs)。Nano Banana 2(汎用)、Nano Banana Pro(プロ向け)との棲み分けは blog に載っています。

Gemini Omni Flashgemini-omni-flash-preview)は、Google I/O で消費者向けに示された Omni ファミリー の開発者向け初版です。テキスト・画像・動画を入力に、720p・最大 10 秒の MP4(音声付き)を生成し、自然言語で逐次編集できます。料金は出力動画 $0.10 / sec で、Veo 3.1 Fast と同額です(blogOmni docs)。

API からは Interactions API 経由で呼び出します。client.interactions.create で生成し、続く編集では previous_interaction_id に前回の interaction ID を渡すと、動画を再アップロードせず文脈を引き継げます(Omni docs)。blog では、セッション履歴を保ったまま最大 3 回の逐次編集を積める、と説明されています。アスペクト比は 16:9(既定)と 9:16、参照入力は画像最大 7 枚・動画最大 3 本(各 3 秒以下)が Cloud docs の仕様です。

現時点の制約も blogOmni docs に明示されています。

  • 音声参照のアップロードと scene extension は API 未対応
  • 3 秒以下の動画参照はスキーマ上受け付けるが、現状モデル側で正しく処理されない
  • シーン変更やパン時のキャラクター一貫性に限界あり
  • EEA / スイス / 英国では、ユーザーがアップロードした動画の編集は未対応(モデル生成動画の編集は可)
  • store=false にすると previous_interaction_id での後続編集ができない

出力には SynthID 透かしと C2PA(Content Credentials)が付きます。デモとして Anywhere(静止画→ランドマーク画像→動画)、Space Lift(室内リデザイン)、Omni Product Studio(EC 向け商品動画)が blog で紹介されています。Nano Banana 2 Lite でラフ画像を大量生成し、Omni Flash で動画化するパイプラインが、今回の主な組み合わせ方です。

NotebookLM の Short Video Overviews

NotebookLM は、アップロードしたソースから 60 秒の縦型ビデオを生成する Short Video Overviews を追加しました(NotebookLM)。ナレーション付きの教育向けアニメーションで、Landscape の Video Overviews や Cinematic Video Overview に加える第三の動画形式です。画像生成には Nano Banana 2 Lite を使います(9to5Google)。

Google AI Ultra / Pro サブスクライバー向けにモバイルと Web で展開中で、無料ユーザー向けも近いうちに、と案内されています。現時点では英語ソースのみです(The Verge)。

Pi と Claude Agent SDK

Mario Zechner 氏(pi の作者)は Sonnet 5 リリースに合わせた pi の新バージョンを予告し、同じモデルでもランタイム次第でコストが大きく変わる例として Sentry Warden のベンチ を推奨読書に載せていました(投稿)。既知脆弱性 corpus 86 件のセキュリティレビューでは、Sonnet 4.6 + Pi が 25/86、+ Claude Agent SDK が 24/86 と recall はほぼ同じです。scan コストは Pi $11.20 に対し Claude Agent SDK $61.61 で、SDK 側はターンあたりの入力コンテキストが大きく、同じファイルでも Read / Grep を繰り返して膨らむ、と Warden の分析 には書かれています。

Devtools系

Nub Web Worker API: Colin McKenzie(colinhacks)は、Nub v0.2.0 で stock Node.js に Web Worker API を追加したと報告しました(colinhacks)。node:worker_threads 上に WHATWG 形状の Worker を載せ、TypeScript / JSX の worker エントリをビルドステップなしで走らせます(v0.2.0 releaseIntroducing Nub)。nodejs/node#43583 は長年の #1 upvote issue として言及されていました。

Matt Pocock writing-great-skills: mattpocock/skillswriting-great-skills は、Agent Skill の書き方リファレンスです。model-invoked と user-invoked の使い分け、description の書き方、steps / reference の情報階層、leading word、no-op の削り方などを SKILL.mdGLOSSARY.md で整理しています。Matt Pocock 氏は自分が最も頻繁に呼ぶスキルになった、と紹介していました(Matt Pocock)。npx skills@latest add mattpocock/skills で選択インストールできます。

Vercel AI CLI audio: Chris Tate 氏は AI CLI に ai audio speakai audio transcribe を追加したと案内しました。stdin も使え、AI Gateway 経由です(Chris Tate)。人間向けは npm install -g ai-cli、エージェント向けは npx skills add vercel-labs/ai-cli です。