GeminiのTPU戦略と100万トークンの正体——Claude Codeとのハイブリッド活用法

「100万トークンの窓って、そもそもなぜ実現できてるの？」という疑問に答えつつ、GeminiとClaude Codeをどう使い分けるかを整理してみます。

そもそも「Tensor（テンソル）」って何？

TPUの”T”はTensor（テンソル）の略です。AIの話でよく出てくる言葉ですが、一言でいうと多次元配列のことです。

例えばグレースケール画像は「縦×横」の2次元、カラー画像なら「縦×横×RGB」の3次元テンソルで表現できます。動画はそこに「時間軸」が加わって4次元です。

ディープラーニングでは、こういった多次元データをひたすら演算し続けます。TPUはその「テンソル計算」を高速にこなすために設計された専用チップ、ということです。

コンテキスト（記憶窓）を広げると計算量が幾何級数的に増え、通常は莫大なコストがかかります。Googleがそれを実現できている理由は、自社製AIチップ「TPU（Tensor Processing Unit）」の存在が大きいです。

Googleはチップからサーバー、データセンターの冷却システムまで自社で最適化しているため、他社が真似できない規模の計算を効率よく行えます。

また、Geminiは「Ring Attention」などの技術を使い、長い情報を分割して効率的に処理する工夫もしています。インフラとアーキテクチャの両面で積み重ねてきた結果が、あの窓の広さです。

窓が広いことで何が変わるか：

100万〜200万トークンあると、ソースコード数万行・数時間の動画・数百ページのPDFを丸ごと一度に読み込めます。「断片的な質問」ではなく「プロジェクト全体を把握した上での相談」ができるようになるのが、本質的なメリットです。

2025年後半から2026年にかけて、開発者コミュニティ（GitHub・X・Zennなど）で共通認識になってきているのが「両方使い分ける」という発想です。それぞれの性格が異なるため、得意な役割も違います。

圧倒的な記憶容量を活かした、俯瞰的な判断が得意です。

コードの論理的正確性と、読みやすいリファクタリング能力が強みです。

例えばスクールのコース構築をする場合、こういった流れが考えられます。

ステップ1（Gemini CLI）：これまでの全教材と新しいコースの構成案をすべて読み込ませて、「既存の教材と重複せず、かつ受講生がワクワクするような技術スタックの組み合わせを、プロジェクト全体を俯瞰して提案して」と指示する。

ステップ2（Claude Code）：その構成案をもとに、具体的なコード実装を任せる。「Geminiが提案したこの構成で、最も保守性の高いコードを書いて」という指示になります。

「大局はGemini、細部はClaude」——これが現在のエンジニアにとって最も生産性が高い布陣と言われています。どちらか一方に絞るより、役割を分けるほうが結果的に速いです。

Gemini CLIを導入したら、自分の過去のプロジェクトのファイルをドバっと読み込ませてみてください。「全部覚えている」感覚は、他のAIではなかなか味わえない驚きがあります。

TAG