
谷歌及其母公司Alphabet的首席执行官桑达尔·皮查伊在接受《麻省理工科技评论》采访时表示:“这种模式天生就更强大。”“这是一个平台。人工智能是一个深刻的平台转变,比网络或移动更大。所以这对我们来说是一大步。”
这对谷歌来说是一大步,但对整个领域来说未必是一大步。谷歌DeepMind声称,在32项标准性能指标中的30项上,Gemini优于GPT-4。然而,他们之间的差距很小。谷歌DeepMind所做的是将人工智能目前最好的能力整合到一个强大的软件包中。从演示来看,它在很多方面都做得很好,但很少有我们以前没有见过的东西。对于所有关于下一个大事件的嗡嗡声,双子座可能是一个迹象,表明我们已经达到了人工智能炒作的顶峰。至少现在是这样。
华盛顿大学(University of Washington)专门研究在线搜索的教授齐拉格·沙阿(Chirag Shah)将此次发布与苹果每年推出一款新iPhone进行了比较。他说:“也许我们现在只是上升到了一个不同的门槛,因为我们已经看到了太多,所以这不会给我们留下那么深刻的印象。”
像GPT-4一样,Gemini是多模式的,这意味着它被训练来处理多种输入:文本、图像、音频。它可以结合这些不同的格式来回答从家务到大学数学再到经济学的各种问题。
在昨天的记者演示中,谷歌展示了Gemini的能力,它可以截取图表的现有截图,用新数据分析数百页的研究,然后用新信息更新图表。在另一个例子中,向双子座展示煎蛋卷在平底锅里煮的照片,并询问(用语音,而不是文字)煎蛋卷是否煮好了。它回答说:“还没做好,因为鸡蛋还在流。”
然而,大多数人将不得不等待完整的体验。今天发布的版本是谷歌基于文本的搜索聊天机器人Bard的后端,该公司表示,这将赋予它更先进的推理、规划和理解能力。Gemini的完整版本将在未来几个月内陆续发布。这款基于双子座的新吟游诗人最初将在170多个国家推出英文版本,不包括欧盟和英国。谷歌负责Bard业务的副总裁萧茜茜(Sissie Hsiao)表示,这是为了让公司与当地监管机构“接触”。
Gemini还有三种尺寸:Ultra、Pro和Nano。Ultra是全功率版本;Pro和Nano专为在有限的计算资源下运行的应用而设计。Nano的设计是为了在设备上运行,比如谷歌的新款Pixel手机。开发者和企业将从12月13日开始使用Gemini Pro。谷歌高管在一次新闻电话会议上告诉记者,最强大的Gemini Ultra将在“广泛的信任和安全检查”后,“明年初”上市。
“我认为这是模特的双子座时代,”皮查伊告诉我们。“这就是谷歌深度思维在人工智能领域的发展和进步。因此,它将永远代表着我们在人工智能技术方面取得进展的前沿。”











