谷歌发布“Gemini 1.5”:增强性能的下一代人工智能

谷歌在推出初版“Gemini AI”仅两个月后,发布了最新的AI模型“Gemini 1.5”。通过实施“Mixture-of-Experts architecture”(MoE)多个AI模型无缝合作,该公司承诺通过这一最新版本可以实现“极大的性能提升”。

作为AI的早期测试版本,Gemini 1.5 Pro具备一个令人印象深刻的功能——长达1百万个tokens的上下文窗口。Tokens是大型语言模型处理和生成文本时使用的最小数据单位。通过增加上下文窗口,谷歌的人工智能可以同时处理大量信息,超越了GPT-4 Turbo等竞争对手的上下文窗口上限只有128,000个tokens。

为了展示Gemini 1.5 Pro的强大能力,谷歌发布了几个视频展示其功能。其中一个示例中,该人工智能分析了一份400页的阿波罗11号登月任务的成文记录,并在几秒钟内准确识别出“喜剧时刻”。该人工智能从大型文本文件中理解、推理和提取信息的能力令人印象深刻。

值得注意的是,Gemini 1.5 Pro的分析能力不仅限于文本。在另一个演示中,该人工智能观看了一部Buster Keaton的电影,并仅凭一个粗略的草图成功地定位到了涉及水塔的特定场景。它在没有任何额外背景或解释的情况下理解了这个草图。

尽管目前仅有开发人员和企业客户可以通过谷歌的AI Studio和Vertex AI平台获得Gemini 1.5 Pro,但公司计划改善延迟时间,并最终使更多人能够使用这一人工智能。然而,Gemini 1.5和Gemini 1.5 Ultra的确切发布日期以及更广泛的可用性尚未公布。

谷歌的Gemini 1.5代表了人工智能技术的重大进步,展示了多模型协作以及处理和理解各种形式复杂信息的潜力。随着AI模型的不断发展,我们可以预期在不久的将来会有进一步的人工智能突破。

常见问题解答:

1. Gemini 1.5是什么?
Gemini 1.5是谷歌发布的最新人工智能模型,它采用“Mixture-of-Experts architecture”(MoE)允许多个人工智能模型无缝协同工作。

2. Gemini 1.5 Pro有什么特点?
Gemini 1.5 Pro具有长达1百万个tokens的上下文窗口。Tokens是大型语言模型处理和生成文本时使用的最小数据单位。

3. Gemini 1.5 Pro与GPT-4 Turbo等竞争对手相比如何?
Gemini 1.5 Pro在上下文窗口方面超越了GPT-4 Turbo等竞争对手,它可以同时处理大量信息,而GPT-4 Turbo的上下文窗口只有128,000个tokens。

4. 有哪些示例可以展示Gemini 1.5 Pro的能力?
谷歌发布了几个视频展示Gemini 1.5 Pro的能力。其中一个视频显示了这一人工智能分析了一份400页的阿波罗11号登月任务的成文记录,并在几秒钟内准确识别出“喜剧时刻”。另一个视频展示了这一人工智能仅凭一个粗略的草图就能找到Buster Keaton电影中的特定场景。

5. 目前谁可以使用Gemini 1.5 Pro?
Gemini 1.5 Pro目前可以由开发人员和企业客户通过谷歌的AI Studio和Vertex AI平台使用。

6. 是否有计划使Gemini 1.5更广泛可用?
是的,谷歌计划改善延迟时间,并最终使Gemini 1.5及其Ultra版本更广泛可用。然而,确切的发布日期和更广泛的可用性尚未公布。

关键术语/行话解释:

– AI:人工智能的缩写,指的是机器模拟人类智能的能力。
– Gemini:谷歌发布的AI模型的名称。
– Mixture-of-Experts architecture (MoE):允许多个人工智能模型有效协作的架构。
– Tokens:大型语言模型处理和生成文本时使用的最小数据单位。
– 上下文窗口:指AI模型在给定文本中可以处理和理解的周围token的数量。

相关链接:
– Google AI

The source of the article is from the blog meltyfan.es

Privacy policy
Contact