Gemini 概要

Googleが提供するマルチモーダルAI。最大200万トークンの入力枠を活かした大規模ソースの解析が強み。

特徴と機能

200万トークンのコンテキスト窓

Gemini 1.5 Pro は最大200万トークンの入力をサポート。システム全体のソースコードや長時間の動画・音声を一度に読み込ませて分析が可能です。

ネイティブ・マルチモーダル

最初から画像や音声、動画などを同時に理解するようにトレーニングされているため、図表やUIデザインからのHTML生成等でも高い精度を誇ります。

Google エコシステム統合

Firebase Genkit や Google Cloud (Vertex AI) を通じたアプリケーション実装が容易で、インフラとAIロジックをスムーズに結合できます。

SDKによる基本的なAPI呼び出し例(Node.js)

import { GoogleGenAI } from "@google/generative-ai"; // APIクライアントの初期化 const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); // モデルの取得 (Gemini 1.5 Pro) const model = ai.getGenerativeModel({ model: "gemini-1.5-pro" }); // コンテンツ生成の実行 const response = await model.generateContent({ contents: "簡単なNode.jsのExpressサーバーの実装コードを出力して。" }); console.log(response.text);

基本情報

名称 Gemini (ジェミニ)
開発企業 Google
コンテキスト窓 最大 2,000,000 トークン (Gemini 1.5 Pro) / 1,000,000 トークン (Gemini 1.5 Flash)
主なモデル一覧 Gemini 1.5 Pro (高度な推論・大容量コンテキスト)、Gemini 1.5 Flash (高速・軽量)、Gemini 1.0 Ultra (旧フラッグシップ)