对用户来说,聊天机器人占据了一个棘手的领域——它们必须同时是搜索引擎、创作工具和助手。对于来自谷歌的聊天机器人来说尤其如此,谷歌越来越依赖人工智能来补充其搜索引擎、语音助手以及其武器库中几乎所有的生产力工具。
目前,谷歌人工智能的终极版本是Gemini Advanced,它于上周推出,用户愿意每月支付20美元来获得这项特权——OpenAI对其升级版ChatGPT Plus的收费与此相同。因此,我花了20美元,决定看看Gemini Advanced是如何与竞争对手较量的。
老双子座已经很不错了。它可以总结莎士比亚的作品,推荐茶饮,还能做出一份还过得去的巧克力蛋糕食谱。但它不能给你一张雄伟的马的照片——至少直到最近——并且可能比ChatGPT的反应要慢。
现在,双子座高级版承诺要做的不仅仅是回答问题或给出悬崖笔记的书籍摘要。Gemini Advanced运行在一个更强大的人工智能模型——Gemini Ultra上,它可以翻译文本,在一个句子中处理多个指令,并从更复杂的提示生成图像。
最终,我发现Gemini Advanced的工作方式和承诺的一样——只是有些事情做得不那么好。它的竞争对手ChatGPT Plus由于集成了DALL-E - 3,能够生成不那么可怕的照片。但Gemini Advanced甚至比Gemini更擅长告诉用户当前事件,而且多亏了谷歌地图(Google Maps),它甚至能更好地提供人们搜索的企业信息。拿薪水的双子座人往往更擅长完成这类“谷歌任务”,而不是生成式人工智能任务。
要从这些聊天机器人那里获得一致、准确的结果,还有很多工作要做,人们需要继续使用它们,让机器人学习如何最好地回答问题。下面是我做的一些测试,看看它们的性能如何。
ChatGPT Plus vs Gemini Advanced
给我画一幅白色的金色涂鸦,在阳光照耀下穿过雏菊的田野
奇怪的是,也许是由于提示的特殊性,两个聊天机器人返回非常相似的生成图像。然而,Gemini Ultra的狗狗照片引起了Verge其他工作人员的“轻微恐惧”。它的狗有两条舌头和一条额外的肢体。它过分强调了皮毛的纹理,所以它看起来……错了。我不知道这样一只狗是否还会在雏菊地里快乐地嬉戏。与此同时,ChatGPT调用dall - e3来生成图像。它的狗不会引起身体上的恐惧,但你仍然可以看到它是一张数码照片。
翻译一下:Panatang makabayan,原意是菲律宾人,tahanan ng king lahi
谷歌表示,Gemini Ultra是为处理“高度复杂的任务”而设计的,所以我向Gemini Advanced询问了这些任务是什么。聊天机器人回答:“翻译。”所以我请Gemini Advanced翻译菲律宾爱国誓言的前几行。这是一个相当晦涩的誓言,特别是因为我所知道的版本在过去的20年里已经改变了好几次。
Gemini Advanced立即回应说,虽然它“接受过语言子集的训练”,但它无法帮助我处理我的请求。我问它支持哪些语言,但聊天机器人拒绝回答,说它不能给我一个它能理解的语言的明确列表。然后我问Gemini Advanced是否懂菲律宾语,他们的回答是肯定的。不过,谷歌官方并未将菲律宾语列入Gemini目前支持的40种语言中。
将这张照片的背景改为纯粉色背景
被在花丛中奔跑的变异狗的形象所困扰,我需要净化我的味蕾。所以我上传了一张我朋友的狗圣代的照片,这样我就可以让它看起来像她在拍照一样。我要求两个聊天机器人删除现有的背景,并用粉红色的背景取而代之。我用ChatGPT Plus测试了这款软件,因为DALL-E 3应该能够简单地编辑照片。我可能无意中弄坏了两个聊天机器人,因为它们都不能满足我的要求。取而代之的是,双子座重新制作了一张金色的雏菊涂鸦,但这次用了粉红色的背景。ChatGPT不能生成任何东西,说明分析提示花费的时间太长。
纽约有哪家好的菲律宾餐厅?纽约有哪家好的埃塞俄比亚餐厅?
Gemini Advanced可以利用谷歌的其他产品,当它在这两个问题上使用谷歌地图时,这对它很有利。它返回了纽约市几家菲律宾和埃塞俄比亚餐馆的概要,并附上了每家餐馆的谷歌地图坐标。
几天前,我要求ChatGPT Plus推荐餐馆——不是为了这次测试,我只是想找新的餐馆——结果是不准确的。餐馆的名字是正确的——这些都是确实存在的——然而,没有一个地点是正确的。我重新提示ChatGPT Plus进行了这次测试,得到了更准确的位置,但餐馆列表更少了。所以在这种情况下,双子座显然更适合这个要求。
总结这些段落,然后写一篇150字的文章布特它
像我这样的人使用聊天机器人的主要原因之一是总结复杂的论文。我给Gemini Advanced提供了苹果最近关于人工智能图像编辑的论文中的两段话。这篇论文第一次读的时候让我很头疼,所以我想双子座至少会给我一些要点。为了充分测试它的新功能,我还想看看聊天机器人是如何将两个不同的指令串在一起的。一个是要求总结;另一种方法是让它生成文本。
总结……还过得去。它确实给了我那两段所讨论的概念的概要,但它并没有把它“翻译”成通俗易懂的语言。也许我应该提示一下。然后双子继续写我要的那篇文章,你知道吗?这150个字比我要求的总结要好得多。
双子座先进型是有能力的。不可否认,它比低级别的双子座工作得好得多。当它与谷歌的搜索和地图等其他产品整合在一起时,效果肯定是最好的。但对于更明显的“创造性”多模式请求——例如涉及图像的事情——Gemini还有很长的路要走。聊天机器人可以理解更长的指令串,但一旦你添加了照片,你可能最好选择一个专门设计的人工智能模型来制作照片。
有话要说...