首页 > web3 >谷歌新AI工具MUM:让搜索如聊天般自然

谷歌新AI工具MUM:让搜索如聊天般自然

来源: 2025-05-02 07:11:57

谷歌通过人工智能重塑搜索体验,MUM系统是关键。MUM旨在理解全球人类语言的细微差别,提升搜索的自然性。谷歌正积极开发MUM,以实现像与朋友聊天一样自然的搜索体验。

谷歌正在通过人工智能重塑搜索体验

谷歌在过去二十多年间一直是网络索引的领头羊,现在他们正努力让AI更好地理解人类语言的细微差别,以提升搜索体验。未来,谷歌希望搜索体验能像与朋友聊天一样自然。最近,他们推出了一款名为MUM(多任务统一模型)的人工智能系统,旨在全球范围内理解人类语言的细微差别,帮助用户更轻松地找到信息,或提出更抽象的问题。虽然MUM目前还未正式应用于谷歌的搜索系统,但谷歌团队正在积极开发以完善这一系统。

谷歌新AI工具MUM:让搜索如聊天般自然

MUM解决疫苗名称搜索问题

在新冠疫苗刚上市时,谷歌搜索副总裁Pandu Nayak及其团队设计了一种“体验”,在用户搜索时提供有关COVID疫苗的详细信息,如获取地点、工作原理和购买渠道。这种信息被整合并展示在搜索结果第一页的顶部。为了实现这一点,团队需要对系统进行编程,使其仅在用户查询COVID疫苗时显示这些信息。但问题在于,全球各地的人们可能使用不同的名称和方式来提及COVID疫苗。过去,团队花费了数百小时来梳理各种疫苗名称,但现在有了MUM系统,Nayak表示:“我们能够用MUM进行一个非常简单的实验,在几秒钟内就能用50种不同的语言为17种不同的疫苗生成800多个名称。”短期内,谷歌希望使用MUM来改善现有的功能和体验,而不是引入全新的功能。

在Google I/O上亮相

在春季的Google I/O开发者大会上,谷歌高级副总裁Prabhakar Raghavan揭示了MUM的潜力。这项基于机器学习的新技术,是谷歌过去十年在搜索技术上不断改进的结果。谷歌声称,MUM能够深入理解世界,理解并生成语言,同时在75种语言上进行训练。此外,内部试验还测试了MUM是否能理解不同形式的信息,如文本、图像和视频。Raghavan在I/O大会上用一个简单示例说明了MUM的复杂性:如果你问谷歌,“我已经爬过亚当斯山,现在想在明年秋天去爬富士山,我应该做哪些不同的准备?”这是一个你会随便问朋友的问题,但当前的搜索引擎无法直接回答,因为它们无法理解这种对话和语言的细微差别。理想情况下,MUM将理解你想比较两座山峰的区别,并理解爬这两座山需要的准备,包括针对地形的健身训练和适合秋季天气的徒步装备。它将能够剖析你的问题并将其分解为一组查询,了解问题的各个方面,然后重新组合在一起。谷歌的工程师们正在努力实现这种搜索体验,尽管实现这一目标的时间尚不确定。中期来看,谷歌正在训练MUM识别文字和图像之间的关系,并取得了不错的进展。例如,当要求MUM为输入的新文本生成图像时,如“西伯利亚哈士奇”,它确实“做得非常出色”。

搜索简史

自1998年成立以来,谷歌一直在绘制网络地图,收集大量内容,并创建索引来组织所有信息。你可以把谷歌搜索索引想象成一本书的索引,它会告诉你某个特定单词出现的所有页面。但与书籍不同的是,网络上有数万亿的页面,你可以一次查找单词的组合。Nayak说:“基于这种规模和组合,我们每天都会收到来自世界各地的数十亿次查询。值得注意的是,我们每天获得的15% 的搜索是以前从未见过的。查询流中有令人难以置信的新奇之处。”部分新奇的内容是因为拼错单词,部分是因为世界在不断变化,人们要求新的(有时是非常具体的)事物。为了尽可能精简所有可能的网络信息并与你的查询相关,谷歌使用一种算法,根据新鲜度和位置等因素,以及不同页面之间的链接方式,将它认为最有用的页面排在顶部。Nayak说:“到目前为止,最重要的一类因素与语言理解有关,语言理解确实是搜索的核心,因为你需要了解查询的含义和文档的含义,以及这两者如何相互匹配。”虽然软件无法像人类那样真正理解语言,但程序员可以开发各种策略,尽量接近我们理解语言的方式。例如,16年前,谷歌建立了同义词系统的第一个版本,它解释了不同的单词在不同的上下文中具有不同的含义。因此,当你谈论笔记本电脑的亮度时,“change”可以表示“adjust”。如果不能理解这一点,由于单词选择的变化,许多相关页面将被排除在搜索结果之外。

机器学习进化

大约六年前,谷歌推出了其第一个基于机器学习的搜索版本,并在此基础上不断改进。这些改进基于深度学习社区围绕自然语言算法的大量研究,这些算法可以查看单词用于理解其含义的上下文,并找出上下文的哪些部分需要注意。2019年,谷歌推出了用于搜索的BERT架构。它的训练算法实际上是一系列“填空”练习。你可以用一个常用短语,屏蔽掉随机单词,然后让网络预测这些单词是什么。它也被称为掩码语言模型。对于像“你能在药房为某人买药”之类的查询,以前搜索者会得到一个关于在药房取药的结果。而BERT架构则能理解,它不仅是拿一张处方,还能理解到这是为朋友或家人开处方。Nayak说:“我们能够得出一个相关性更高的结果”。展望未来,MUM不仅能够像BERT这样理解语言,还能够生成语言。相比之下,MUM比BERT功能更强大得多,谷歌称其功能大约是BERT的1000倍。MUM在谷歌提供的所有不同语言的公共网络语料库的高质量子集上接受训练。搜索团队会删除低质量内容、成人内容、露骨内容、仇恨言论,因此MUM学习的语言在某种意义上是更为积极的。但Nayak承认,像MUM这样的大型语言模型肯定存在巨大的挑战需要团队努力解决。例如,一个是偏见问题。因为这是从网络语料库中训练出来的,所以人们担心它是否反映或加强了网络中存在的偏见。Nayak希望,它是在语料库的高质量子集上训练的这一事实将消除一些最严重的偏见。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。