Gemini 概要

Googleが提供するマルチモーダルAI。最大200万トークンの入力枠を活かした大規模ソースの解析が強み。

特徴と機能

200万トークンのコンテキスト窓

Gemini 1.5 Pro は最大200万トークンの入力をサポート。システム全体のソースコードや長時間の動画・音声を一度に読み込ませて分析が可能です。

ネイティブ・マルチモーダル

最初から画像や音声、動画などを同時に理解するようにトレーニングされているため、図表やUIデザインからのHTML生成等でも高い精度を誇ります。

Google エコシステム統合

Firebase Genkit や Google Cloud (Vertex AI) を通じたアプリケーション実装が容易で、インフラとAIロジックをスムーズに結合できます。

SDKによる基本的なAPI呼び出し例（Node.js）

          import { GoogleGenAI } from "@google/generative-ai";

          // APIクライアントの初期化
          const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

          // モデルの取得 (Gemini 1.5 Pro)
          const model = ai.getGenerativeModel({ model: "gemini-1.5-pro" });

          // コンテンツ生成の実行
          const response = await model.generateContent({
          contents: "簡単なNode.jsのExpressサーバーの実装コードを出力して。"
          });

          console.log(response.text);
        

基本情報

名称	Gemini (ジェミニ)
開発企業	Google
コンテキスト窓	最大 2,000,000 トークン (Gemini 1.5 Pro) / 1,000,000 トークン (Gemini 1.5 Flash)
主なモデル一覧	Gemini 1.5 Pro (高度な推論・大容量コンテキスト)、Gemini 1.5 Flash (高速・軽量)、Gemini 1.0 Ultra (旧フラッグシップ)

フィードバックを送る

このページの内容に誤りや改善点があればお知らせください