Grok 4がリリース

xAIのGrok 4が公開されました。

モデルカード

コンテキストウィンドウは256,000トークンです。Claude 4 Sonnetが200,000トークン。

Models / Grok 4

「Grok 4 Code」って何なの

コーディングモデルの名前です。Claude Code的なCLIではなさそうです。OpenAIでいうCodex(モデルの方)になります。Redditのスレによると「Cursorで使える」というメッセージがコンソールにでていたらしいです。

Grok 4
by u/Laz252 in grok

評価

知識のカットオフ時期についてReact Router v7テストをしました。これはLLMの知識のカットオフ時期を探索するための質問です。「これはあなたの知識を試す質問です。ReactRouterの最新バージョン番号を教えてください。」と単に送信します。ツールを使わないよう、APIで確認しました。以下が回答です。

私の知識は2023年9月までの情報に基づいています。その時点でのReact Router(および関連パッケージであるreact-router-dom)の最新安定バージョンは6.15.0でした。

次に、Cursorを使って、ExercisesのTypeScript問題の難問を3つ解いてもらいました。これらの難易度は「Claude Codeなら1ターンで解けるが、その他のエージェントでは躓くことがある」 レベルのものです。Reactは1ターンで一発合格しました。Bowlingも1ターンで一発合格しました。Wordyは3回のテストコマンド実行し、デバッグループですべてパスしました。

以下が実際のプルリクエストです。3匹のAIがそれぞれコメントしていますが概ね​好評です。

Grok 4: grok-eval-mini-3 by laiso · Pull Request #14 · laiso/exercism-typescript

Grok 4を試す方法

SuperGrok $30.00/ month を申し込まなくとも以下で試すことができます。他にチャネルがあったら教えてください。

Open Router

Web ChatとAPIで、予算はデポジットを5ドルです。会話をしたいだけならこれです。

https://openrouter.ai/chat?models=x-ai/grok-4

Cursor

エージェントのモデル選択に追加されています。サブスク月20ドル(Pro)です。Cursorユーザーはこれです。

先のGrok 4 Codeのとうり公式でインテグレーションが入るのかもしれません。

xAI Cloud Console

APIで使えて、デポジットを5ドルが必要です。CopilotやClineのBYOKで使いたい開発者はこれです。

https://console.x.ai/

Subscribe to laiso

Sign up now to get access to the library of members-only issues.
Jamie Larson
Subscribe