Gemini 是谷歌公司开发的一款人工智能模型。
12 月 6 日,正式推出 Gemini 1.0 版本。
2024 年 2 月 15 日,发布 Gemini 1.5。
2024 年 12 月 12 日,发布人工智能大模型 Gemini 2.0。
2025 年 2 月 5 日,宣布产品线全面上新,包括正式版 Gemini 2.0 Flash、Gemini 2.0 Flash Thinking 、DeepReserch等功能。
四种版本:
- Gemini Ultra:最大、功能最强的模型,可执行高度复杂的任务。
- Gemini Pro:用于多种任务扩展的最佳模型。
- Gemini Flash:是 Pro 的一款速度更快的“精简版”。它还有一个略小但速度更快的版本,称为 Gemini Flash-8B。
- Gemini Nano,有两种小型型号: Nano-1 和功能更强大的 Nano-2,后者可离线运行。

1、Gemini Ultra
谷歌表示, Gemini Ultra 由于其多模式性,可以用来帮助完成物理作业、在工作表上逐步解决问题以及指出已填写答案中可能存在的错误。
谷歌表示,Ultra 还可以用于识别与问题相关的科学论文等任务。例如,该模型可以从多篇论文中提取信息,并通过生成必要的公式来更新其中的图表,从而使用更及时的数据重新创建图表。
Gemini Ultra 在技术上支持图像生成。但该功能尚未进入模型的产品化版本——可能是因为该机制比 ChatGPT 等应用程序生成图像的方式更复杂。Gemini 不会将提示输入到图像生成器(如 ChatGPT 中的DALL-E 3),而是“原生”输出图像,无需中间步骤。
Ultra 可通过 Vertex AI(Google 完全托管的 AI 开发平台)和 AI Studio(Google 为应用程序和平台开发人员提供的基于网络的工具)作为 API 提供。
2、Gemini Pro
谷歌表示,Gemini Pro 在推理、规划和理解能力方面比 LaMDA 有所改进。最新版本 Gemini 1.5 Pro(为 Gemini Advanced 用户提供 Gemini 应用)在某些领域的性能甚至超过了 Ultra。
与前代产品Gemini 1.0 Pro 相比,Gemini 1.5 Pro 在多个方面都有所改进 ,其中最明显的改进可能就是其处理的数据量。Gemini 1.5 Pro 最多可以存储 140 万个单词、两小时的视频或 22 小时的音频,并且可以对这些数据进行推理或回答相关问题(或多或少)。
Gemini 1.5 Pro 于 6 月在Vertex AI和 AI Studio上正式发布,同时还推出了一项名为“代码执行”的功能,该功能旨在通过分多个步骤迭代优化代码来减少模型生成的代码中的错误。(代码执行还支持 Gemini Flash。)
在 Vertex AI 中,开发人员可以通过微调或“基础”过程针对特定环境和用例定制 Gemini Pro。例如,可以指示 Pro(以及其他 Gemini 模型)使用来自第三方提供商(如 Moody’s、Thomson Reuters、ZoomInfo 和 MSCI)的数据,或从公司数据集或 Google 搜索(而不是其更广泛的知识库)获取信息。Gemini Pro 还可以连接到外部第三方 API 来执行特定操作,例如自动化后台工作流程。
AI Studio 提供使用 Pro 创建结构化聊天提示的模板。开发人员可以控制模型的创作范围,并提供示例来提供语气和风格指导,还可以调整 Pro 的安全设置。
Vertex AI Agent Builder 可让人们在 Vertex AI 中构建由 Gemini 驱动的“代理”。例如,一家公司可以创建一个代理,该代理会分析以前的营销活动以了解品牌风格,然后应用这些知识来帮助产生与该风格一致的新创意。
3、Gemini Flash
虽然 Gemini Flash 的第一个版本是为要求较低的工作负载而设计的,但最新版本2.0 Flash现在是 Google 的旗舰 AI 模型。Google 将 Gemini 2.0 Flash 称为其代理时代的 AI 模型。该模型除了文本之外,还可以原生生成图像和音频,并且可以使用 Google 搜索等工具并与外部 API 交互。
Flash 是 Gemini Pro 的一个分支,体积小巧、效率高,专为窄带、高频生成式 AI 工作负载而打造。2.0 Flash 模型比 Gemini 的上一代模型更快,甚至在编码和图像分析基准测试中胜过一些较大的 Gemini 1.5 模型。与 Gemini Pro 一样,Flash 也是多模式的,这意味着它可以分析音频、视频、图像和文本(但只能生成文本)。谷歌表示,Flash 特别适合摘要和聊天应用等任务,以及图像和视频字幕以及从长文档和表格中提取数据。
Gemini 2.0 Flash 现已作为实验模型通过Google AI Studio和Vertex AI中的 Gemini API 向开发者提供,所有开发者均可使用多模式输入和文本输出,早期合作伙伴可使用文本转语音和原生图像生成功能。
4、Gemini Nano
Gemini Nano 是 Gemini Pro 和 Ultra 型号的小型版本,效率足够高,可以直接在(某些)设备上运行,而不必将任务发送到某个服务器。到目前为止,Nano 为 Pixel 8 Pro、Pixel 8、Pixel 9 Pro、Pixel 9 和 三星 Galaxy S24提供了一些功能,包括录音机中的摘要和 Gboard 中的智能回复。
录音机应用允许用户按下按钮来录制和转录音频,其中包括 Gemini 支持的录音对话、采访、演讲和其他音频片段摘要。即使没有信号或 Wi-Fi 连接,用户也可以获得摘要 — 并且为了保护隐私,任何数据在处理过程中都不会离开手机。
免责声明:本文内容,图片来源于互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权归其原作者所有。如发现本站有侵权/违法违规的内容,侵犯到您的权益,请联系站长,一经查实,本站将立刻处理。
