Google发布新一代AI 模型 Gemini对抗GPT-4

Google 最近发布了一款名为 Gemini 的原生多模态大模型。这款模型支持文本、图像、视频和音频输入,并具备强大的推理和生成能力。Gemini 分为 Ultra、Pro 和 Nano 三个版本,其中 Ultra 在多模态测试中表现优异。此外,Google 还发布了 AlphaCode2,结合 Gemini 实现了协同编程的突破。

Gemini 的特性

Gemini 是 Google 发布的新的大模型,它最大的特性就是原生多模态(native multimodality),可以无缝地理解和操作包括文本、代码、音频、图像和视频在内的不同类型的信息。它能够理解用户图表,推断生成它所需的代码,遵循用户指令将子图放置在其期望的位置,以及关于输出图表的抽象推理。

Gemini 的版本

Gemini 有三个版本:Ultra,Pro 和 Nano。Ultra 是最大和最有能力的模型,设计用于处理高度复杂的任务。Pro 是最适合广泛任务扩展的模型。Nano 是最高效的机型,适用于设备上的任务。

file

Gemini 的性能

根据 Google 的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。在 32 个广泛使用的学术基准测试中有 30 个都表现出了超越当前时代的“先进结果”。

file

AlphaCode2 的发布

Google 还发布了 AlphaCode2,这是一款由 Gemini 加成的产品,可能是人和 AI 协同编程的开端。AlphaCode2 主要新增的特性就是跟 Gemini Pro 结合,在一些代码编写上性能很强。

Gemini 的复杂推理能力

Gemini 的复杂推理能力表现在它可以自动找到大约 20 万篇文献,并且很快读完进行总结。这个功能简直消灭了论文综述这个东西,直接就是最新最全的 review。

Gemini 的后续规划

Gemini 1.0 正在 Google 多个产品和平台上推出。Bard 将使用 Gemini Pro 进行高级推理和规划。Gemini Pro 将支持 170 多个国家的英语版本,并将扩展支持更多语言。Pixel 8 Pro 将成为首款使用 Gemini Nano 的智能手机。Gemini 将被集成到 Google 的搜索、广告、Chrome 和 Duet AI 等服务中。开发者和企业用户将能够通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro。Gemini Nano 将支持在 Android 设备上的任务,并将在 Pixel 8 Pro 上使用。Gemini Ultra 将在通过信任和安全检查后不久推出,并计划在明年初向开发者和企业用户推出。Bard Advanced 将提供接入最优秀模型和功能的新 AI 体验,以 Gemini Ultra 为起点。

Google 的 Gemini 是一款具有原生多模态特性的强大 AI 模型。它在多模态测试中的表现优异,甚至在许多测试中超过了 GPT-4。尽管目前还未对大众开放使用,但其未来的应用前景非常广阔,值得期待。

Palette一款AI即时给黑白图片上色工具
chatgpt发布一周年,我已经离不开它了
标签:

发表我的评论

电子邮件地址不会被公开。 必填项已用*标注

29 + 2 =

ajax-loader