谷歌欲利用Gemini,用手机数据记录人们的生活故事

CnBays.cn湾区中国 | 【睿问财讯-国际】
2023-12-10

《谷歌欲利用Gemini,用手机数据记录人们的生活故事》

— CnBays.cn湾区中国 | 【睿问财讯-国际】


导读:

  • “Project Ellmann”是谷歌内部的一项提案,旨在利用人工智能帮助用户“鸟瞰”他们的生活故事。

  • 这个想法是使用像 Gemini 这样的法学硕士来提取搜索结果,发现用户照片中的模式,创建聊天机器人并“回答以前不可能的问题”有关一个人的生活。

  • 该团队还演示了“Ellmann Chat”,其描述是“想象一下打开 ChatGPT,但它已经知道你生活的一切。”

谷歌的一个团队提议利用人工智能技术,利用照片和搜索等手机数据创建用户生活的“鸟瞰”视图。

根据传记作家和文学评论家理查德·大卫·埃尔曼的名字,这个项目被称为“埃尔曼计划”,其想法是使用像Gemini 这样的AI来获取搜索结果、发现用户照片中的模式、创建聊天机器人并“回答以前不可能的问题”。

目前尚不清楚该公司是否计划在谷歌照片或任何其他产品中提供这些功能。根据公司博客文章,谷歌图库拥有超过 10 亿用户和 4 万亿张照片和视频。

Ellmann项目只是谷歌提议利用人工智能技术创建或改进其产品的众多方式之一。周三,谷歌推出了迄今为止“最强大”且先进的人工智能模型 Gemini,该模型在某些情况下优于 OpenAI 的 GPT-4。 该公司计划通过谷歌云向广泛的客户授权 Gemini,以便他们在自己的应用程序中使用。 Gemini 的突出特点之一是它是多模式的,这意味着它可以处理和理解文本之外的信息,包括图像、视频和音频。

谷歌照片的一位产品经理在最近的一次内部峰会上与 Gemini 团队一起介绍了Ellmann项目。 他们写道,团队在过去的几个月里确定大型语言模型是使这种鸟瞰一个人的生活故事成为现实的理想技术。

演示文稿称,Ellmann可以使用传记、之前的时刻和随后的照片来引入上下文,比“仅带有标签和元数据的像素”更深入地描述用户的照片。 它建议能够识别一系列时刻,例如大学岁月、湾区岁月和为人父母的岁月。

“如果没有鸟瞰你的生活,我们就无法回答棘手的问题或讲述好故事,”一个小男孩在泥土中与狗玩耍的照片旁写着这样的描述。

“我们会仔细浏览您的照片,查看它们的标签和位置,以识别有意义的时刻,”演示幻灯片上写道。 “当我们退后一步,全面了解你的生活时,你的总体故事就会变得清晰起来。”

该演讲称,大型语言模型可以推断诸如用户孩子出生之类的时刻。 “这个法学硕士可以利用树上更高层的知识来推断这是杰克的出生,并且他是詹姆斯和杰玛的第一个也是唯一的孩子。”

“法学硕士对于这种鸟瞰方法如此强大的原因之一是,它能够从这棵树的所有不同高度获取非结构化背景,并用它来改善它对树的其他区域的理解,”幻灯片上写着,旁边还附有用户生活中各种“时刻”和“章节”的插图。

演示者给出了另一个确定用户最近参加过同学聚会的示例。 “他毕业已经整整10年了,到处都是10年没见的面孔,所以这可能是一次重聚,”团队在演示中推断道。

该团队还演示了“Ellmann Chat”,并描述道:“想象一下打开 ChatGPT,但它已经知道你生活的一切。 你会问它什么?”

它显示了一个示例聊天,其中用户询问“我有宠物吗?”它回答说是的,用户有一只狗,它穿着红色雨衣,然后提供了狗的名字以及它最常看到的两个家庭成员的名字。

聊天的另一个例子是用户询问他们的兄弟姐妹上次访问是什么时候。另一个人要求它列出与他们居住地相似的城镇,因为他们正在考虑搬家。Ellmann对这两个问题都给出了答案。

其他幻灯片显示,埃尔曼还总结了用户的饮食习惯。 “你看起来很喜欢意大利菜。 有几张意大利面食的照片,还有一张披萨的照片。” 它还表示,该用户似乎很喜欢新食物,因为他们的一张照片的菜单上有一道它无法识别的菜肴。


CnBays.cn湾区中国|【睿问财讯—国际】综合国内外权威财经资讯,部分国际内容由浦诺英英文精英翻译供稿,睿问财讯编辑整理。来源:网络;图源:网络

【声明】:Cnbays湾区中国 | 【睿问财讯】立足湾区,面向世界,关注产业,助力企业。本网站中英文及图片内容版权属原作者所有,本文转载、摘编、引用、翻译、编辑整理等均出于传播财经等信息之目的和需要,CnBays.cn湾区中国 | 【睿问财讯】刊发所有内容不代表本网任何观点,也不构成任何投资建议。有来源标注错误或文章侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢

联系:ReveMgt_Express@163.com

分享
下一篇:这是最后一篇
上一篇:这是第一篇