やってみたこと：Claude Codeの設定画面を動画でGeminiに渡したを教えてください

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「やってみたこと：Claude Codeの設定画面を動画でGeminiに渡した」について詳しく解説しています。

なぜGeminiは動画に強いのかについて教えてください

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「なぜGeminiは動画に強いのか」について詳しく解説しています。

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「動画をそのまま理解している」について詳しく解説しています。

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「長い動画でも文脈が切れない」について詳しく解説しています。

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「主要AIとの比較（2026年時点）」について詳しく解説しています。

動画をそのままAIに読み取らせてみたら、思ったより全部わかった話における「まとめ：「見せる」だけで伝わる時代」について詳しく解説しています。

AI / Claude Code

2026.05.27

「この設定、どうなってたっけ」というとき、みなさんはどうしていますか？スクリーンショットを何枚も撮ったり、メモを見返したり……けっこう手間ですよね。

今回、ふと試したのが「操作画面を動画で撮って、そのままGeminiに投げてみる」という方法です。結果として、思っていた以上にすんなりと情報を引き出せたので、その内容をシェアしてみます。

Claude Code（デスクトップアプリ）の設定画面をぐるっと見て回る、1分ほどの動画を撮影。それをそのままGeminiに読み込ませて、「この動画に映っている設定内容を教えて」と聞いてみました。

Geminiが読み取ってくれた内容（要約）:

特に驚いたのは、スクロールして一瞬しか映らなかった項目や、画面の端に出ていた設定値まで、ちゃんと時系列で整理されていたことです。「あ、これ人間よりちゃんと見てるな」と思いました。

動画を分析できるAIは増えてきましたが、Geminiにはちょっと違う強みがあります。

多くのAIは、動画を「一定間隔でスクリーンショットを撮って、その画像を順番に見ていく」という形で処理します。一方Geminiは、映像と音声を連続したデータとして直接受け取る設計になっていて、流れや文脈ごと理解できます。

Geminiは、数時間の動画でも文脈を保ったまま処理できる「長いコンテキストウィンドウ」を持っています。「全体を通して何が言われていたか」「どの設定がどのタイミングで変わったか」といった質問にも答えやすいのはこの仕組みのおかげです。

AIモデル	動画の扱い方	向いていること
Gemini (Google)	動画をそのまま読み込むネイティブ方式	長い動画の要約、UIの文字起こし、時系列の整理
GPT-4o (OpenAI)	静止画を抜き出して解析	短い動画での素早い理解、特定のアクションの把握
Claude（Anthropic）	公式チャットでは動画の直接アップロード非対応（画像のみ）	テキストの論理構成やコード生成

「動画をそのまま渡して中身を分析してほしい」という用途では、今のところGeminiが一番使いやすいと感じています。

今回やってみてわかったのは、動画を撮ってAIに渡すだけで、設定のドキュメント化やマニュアル作成がかなり楽になるということ。

「あの設定、どうだったっけ」というときに、録画を見返しながらメモする必要がなくなるかもしれません。記録しておいた動画資産が、あとからAIで活用できる素材になるとしたら、それはちょっとおもしろいですよね。

この記事は、実際のGeminiとの対話・動画解析の実証結果をもとに構成しました。

TAG