Gemini 概要
Googleが提供するマルチモーダルAI。最大200万トークンの入力枠を活かした大規模ソースの解析が強み。
特徴と機能
200万トークンのコンテキスト窓
Gemini 1.5 Pro は最大200万トークンの入力をサポート。システム全体のソースコードや長時間の動画・音声を一度に読み込ませて分析が可能です。
ネイティブ・マルチモーダル
最初から画像や音声、動画などを同時に理解するようにトレーニングされているため、図表やUIデザインからのHTML生成等でも高い精度を誇ります。
Google エコシステム統合
Firebase Genkit や Google Cloud (Vertex AI) を通じたアプリケーション実装が容易で、インフラとAIロジックをスムーズに結合できます。
SDKによる基本的なAPI呼び出し例(Node.js)
import { GoogleGenAI } from "@google/generative-ai";
// APIクライアントの初期化
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
// モデルの取得 (Gemini 1.5 Pro)
const model = ai.getGenerativeModel({ model: "gemini-1.5-pro" });
// コンテンツ生成の実行
const response = await model.generateContent({
contents: "簡単なNode.jsのExpressサーバーの実装コードを出力して。"
});
console.log(response.text);
基本情報
| 名称 | Gemini (ジェミニ) |
|---|---|
| 開発企業 | |
| コンテキスト窓 | 最大 2,000,000 トークン (Gemini 1.5 Pro) / 1,000,000 トークン (Gemini 1.5 Flash) |
| 主なモデル一覧 | Gemini 1.5 Pro (高度な推論・大容量コンテキスト)、Gemini 1.5 Flash (高速・軽量)、Gemini 1.0 Ultra (旧フラッグシップ) |
フィードバックを送る
このページの内容に誤りや改善点があればお知らせください