Gemini 2.0 Flash:快速、高效、多模态的人工智能
Gemini 2.0 Flash 是 Google 最新的 AI 模型,专为速度与效率而设计。它是一款为开发者提供多功能支持的工具,在 Gemini 1.5 Flash 的基础上实现了性能提升。

多模态能力
支持图片、视频、音频和文本输入,输出包括图片、文本以及多语言可调的文本转语音。
高性能与低延迟
在关键基准测试中超越 Gemini 1.5 Pro,运行速度翻倍。专为低延迟、实时互动设计。
100万标记上下文窗口
具备100万标记的上下文窗口,用于处理和推理大量信息。
内置工具使用
原生支持 Google Search、代码执行和第三方用户自定义函数。
成本效率
针对大规模文本输出优化成本,定价简化,每种输入类型统一定价。
图像生成与控制
内置图像生成和可控文本转语音功能实现图像编辑、本土艺术创作和生动叙事。
多模态实时 API
全新的多模态实时 API 促成语音和视频的双向交互。

大规模、高频率任务
适合需要快速处理海量数据的任务。
多模态推理
在文本、图片、音频、视频等多种数据间进行推理。
实时互动
适合需要低延迟响应的应用,如交互式代理。
代理体验
助力开发智能交互代理。

用户评价
