Googleは2025年4月17日にGemini 2.5 Flashの初期バージョンをGemini APIを通じて、Google AI StudioおよびVertex AIでプレビューとして公開しました。このモデルは、旧バージョンである2.0 Flashの核心機能を保ちながら、推論能力を大幅に強化し、速度とコスト効率の面で最適化されています。
核心革新機能
- ハイブリッド推論システム: 開発者が必要に応じて推論機能を有効化/無効化できる完全なハイブリッドモデルです。
- 「思考予算」(Thinking Budget)制御: 複雑性に応じて推論時間を自動調整したり、手動で予算設定を行うことが可能で、質-コスト-遅延時間のバランスを最適化します。
- 性能と価格の競争力: LMArenaベンチマークにおいてHard Prompts基準で2.5 Proに次ぐ強力な性能を誇ります。
技術的仕様
特性 | 説明 |
---|---|
入力トークン | 最大100万トークンをサポート |
出力トークン | 64k(8kから64kに2.0に対して8倍増加) |
知識カットオフ | 2025年1月 |
ツールサポート | 関数呼び出し、構造化出力、検索、コード実行など |
マルチモーダル | テキスト・画像・動画・オーディオ処理可能 |
開発者向け配布情報
- プラットフォーム: Google AI Studio、Vertex AI、Geminiアプリ全面対応
- 使用ケース:
- リアルタイム要約(メール・文書・Webコンテンツ)
- 高速チャット応答およびAIアシスタント
- データ抽出と軽量コード生成
- 最適化アーキテクチャ: Mixture-of-Experts(MoE)によりリソース使用量を削減
2.0 Flashとの改善点
- 出力トークン8倍拡張(8kから64k)
- ツール使用範囲拡大: 構造化出力と関数呼び出しが追加
- プロセス制御強化: 動的推論予算配分システムの導入
現在、Gemini 2.5 FlashはMoody'sなどの企業向けソリューションと統合中であり、Vertex AIでは監視チューニング(Supervised Tuning)およびコンテキストキャッシング機能が間もなく追加される予定です。リアルタイムオーディオ・動画処理のためのLive APIも公開され、多様なエージェントエコシステムの構築が容易になりました。