
什么是 Gemini Flash 2.0 实验版?
Gemini 2.0 Flash 引入了内置图像生成和可控文本转语音功能,支持图像编辑、本地化艺术品创作和富有表现力的故事叙述。
Gemini 2.0 Flash 的核心特性
Gemini 2.0 Flash 融合了速度、多模态和高级功能。
多模态能力
支持图像、视频、音频和文本输入。生成包括图像、文本和多种语言的可控文本转语音 (TTS) 输出。
高性能和低延迟
在关键基准测试中表现优于 Gemini 1.5 Pro,运行速度是其两倍。专为低延迟、实时交互而设计。
100 万 Token 上下文窗口
拥有 100 万 Token 上下文窗口,用于处理和推理大量信息。
Gemini 2.0 Flash 的优势
Gemini 2.0 Flash 在各个领域都具有显著优势。
成本效益
针对大规模文本输出进行了成本优化。简化了定价,每种输入类型采用单一价格。
图像生成与控制
内置图像生成和可控文本转语音功能,支持图像编辑、本地化艺术品创作和富有表现力的故事叙述。
多模态实时 API
新的多模态实时 API 支持双向语音和视频交互。
