今週の話題:Claudeの劣化問題の修正、Claude Code API差し替え、sonoma-alpha
AnthropicがClaudeの性能劣化に対応
Anthropicが公式に、8月からコミュニティで報告されていたClaude Sonnetの性能劣化を修正したと発表しました。原因は推論スタックのインフラ層にあり、独立したバグによるものであり「モデル本体の意図的な性能ダウン」や「需要対策によるダウングレード」は否定されています。

発表には、2025年8月下旬〜9月初旬にかけてSonnet 4系で品質劣化(degraded output quality)が発生し、8月5日〜9月4日には少数のSonnet 4.0リクエストに出力品質の低下が見られたという記載があります。Opus 4.1にはいまだ未解決の問題もあります。
8月中にはRedditでClaude Codeの応答劣化の件は炎上していました。有料プランの週次制限の開始あたりから加熱した印象です。一部ではCodex CLIに乗り換えようという声がありました。
Update on recent performance concerns
by u/AnthropicOfficial in ClaudeAI
日本コミュニティでは7月時点で「Claude Codeをバージョンダウンすると改善する」という口コミがあり、クライアント層の影響も指摘されていました。対策については「"あの頃"の強かったClaude Codeを少しでも取り戻す方法」にまとめられています

筆者の見解としてはこの件では「再現できて説明可能なモデルの問題を修正した」というステータスだととらえており、実際のモデルレイヤーとAPIサービスの運用は専門家でも一筋縄ではいかない再現不可能な問題が多発するカオスが続いているのだと邪推します。それでなければ7月時点の問題にも言及があるはずです。
中国系「Claude Codeモデル差し替え文化」の拡大
最近、中国のモデル開発企業やコミュニティではClaude Codeのモデル差し替えをして利用する流行が見られます。これは「Anthropic APIのふりをして別のモデルに応答させる中継サーバ」のことです。
仕組みは以下の通りです:
- Claude Codeは環境変数に応じたAnthropic APIのBaseURLにリクエストを送信します
- これはAmazon BedrockのAPIでClaude Codeが動作する要件のためにあります
- 間に立つ中継サーバをBaseURLに置き換え(CCRコマンド=Claude Code Routerなど)、そのリクエストをOpenAIやGeminiなど別のモデルAPIに変換して送信します
- 戻ってきたレスポンスを再びClaude形式に変換して返却します
- ユーザーはClaude CodeのCLIをそのまま使用できます
これを実現するOSSプロジェクトがいくつかあります。最も利用されているのがCCRコマンドで呼ばれているClaude Code Routerでしょう。
これがOSSの実装だけでなく、中国のモデル開発企業のAPIエンドポイントでも展開されています。筆者が確認できているのは以下のプラットフォームとモデルです。
- DeepSeek: https://api.deepseek.com/anthropic
- Moonshot AI(Kimi K2): https://api.moonshot.ai/anthropic
- Z.ai(GLM-4.5): https://api.z.ai/anthropic
- Alibaba Cloud(Qwen3-Coder): https://dashscope-intl.aliyuncs.com/api/v2/apps/claude-code-proxy
背景には以下のような事情があります:
- 中国本土からAnthropic公式へのアクセスができないこと
- そのため開発者はVPNアクセスを実行したり、中継サイトを使います
- Z.aiの「CC-Bench」のような、直接的な競争体質
- GLM-4.5の発表時にClaude Code Routerを使ったベンチマークを記載
しかし、Claude Code改造リポジトリのAnonKodeをDMCAテイクダウンし、WindsurfやOpenAIの開発時のAPIアクセスをブロック。ユーザーのテレメトリ収集同意のためClaude Codeにも同意ステップを追加した[1]Anthropicの対応を踏まえると、このプロキシレイヤーは早々に防がれてしまうのではないかという見方もあります。
[1]: https://www.anthropic.com/news/updates-to-our-consumer-terms
PS: Claude Codeとこれらのエンドポイントを組み合わせたベンチマークの結果はこちらです。GLM 4.5 > Kimi K2 > DeepSeek v3.1 という成績でした(Qwen3-Coderは未実施)。
sonoma-sky-alpha / sonoma-dusk-alpha の正体はGrok 4.20?
Introducing Sonoma Alpha, two new stealth models 🥷
— OpenRouter (@OpenRouterAI) September 6, 2025
Context: 2 million tokens
Price: Free pic.twitter.com/WfxeMdNMs3
sonoma-sky-alpha / sonoma-dusk-alphaはOpenRouter経由でアナウンスされたステルス(匿名)モデルです。2Mトークンの巨大コンテキストでマルチモーダル入力に対応しています。このため、一部ではすでに同レベルのスペックを持つ「Gemini 系統のGemini 3ではないか」との推測もありましたが、特定のプロンプトへの応答や過去のリリース手法からxAIのGrok 4.20系とみる声が有力でした。
Adam Holterによる分析記事では、アイアンマンのキャラに言及することや、ポルトガル語・スペイン語応答傾向、不可視Unicode文字の読解など、過去のGrok系と一致するとしています。
Sonoma Dusk Alpha & Sonoma Sky Alpha: Exploring xAI’s Stealth LLMs with 2M Token Context Windows
こうしたステルスモデルは開発元企業がOpenRouterやOpenCode、Clineなどのプラットフォーム経由で無料でアルファ提供して、評判やユーザーの利用データを収集する形態になっています。
OpenAIやxAIにとどまらずこうした「アルファ公開+フィードバック収集」は、今後も増加する可能性が高いです。その度に評価に注意を奪われていると時間が足りないので、拙作TS-benchのようなハーネスが浪費防止に役立つと考えられますね。OpenAIもGPT-5発表時のペーパーで「社内のプルリクエストと同じコードを再現できるか測るベンチマークがある」と言及していました。
5.1.3.2 OpenAI PRshttps://t.co/XPdb5sGme2
— Iaiso (@laiso) August 11, 2025
ベンチマークの結果はこちらです。成績は特によくありません。並。
- sonoma-sky-alpha: https://github.com/laiso/ts-bench/actions/runs/17511027296
- sonoma-dusk-alpha: https://github.com/laiso/ts-bench/actions/runs/17511035353
今週のまとめ
- Claudeのモデル品質劣化にAnthropicが対応
- 中国発のClaude Codeモデル差し替え文化が拡大
- OpenRouterでのステルスモデル配布が常態化