【嘉德点评】谷歌发明的信息搜索系统在搜索过程中动态调整的算法在现有的搜索系统中还是比较少见,可以达到智能化的搜索效果,更加贴合用户习惯。
集微网消息,谷歌过去十年,在搜索引擎上做出了巨大努力,其努力的方向就是不断完善搜索引擎算法,不断打击非真实的数据。
2012年谷歌推出的熊猫算法,显然已经融入了人工智能搜索引擎部分技术,增加了对于网站内容价值的分析,这是搜索引擎算法的技术的明显提升,这一点突破了过去搜索引擎的算法缺陷,增加了网站内容的可读性和有益性,同时也更加凸显了网站的权威属性,在对于用户评价以及信任度上,也有了很大的提升。
近年来,搜索引擎不断朝着智能化的方向发展,旨在给用户提供足够的信息以及获得更加精准的搜索数据,从而给用户带来更加良好的浏览器搜索体验。
为了达到这个目标,谷歌在18年5月15日申请了一项名为“预测对于特定场景的搜索的意图”的发明专利(申请号:201880032893.4),申请人为谷歌有限责任公司。
根据目前该专利公开的资料,让我们一起来看看这项智能搜索技术吧。
如上图为用于预测与搜索查询相关联的、基于意图调整搜索结果的系统概念图,可以看到系统主要由网络130和用于通信的信息服务器系统160组成。网络用于在计算系统、服务器和计算设备之间传输数据,信息服务器系统经由网络与计算设备交换数据,用来提供计算设备所需要的搜索服务。
在提供搜索服务的过程中,信息服务器需要不断的与计算设备进行通信,以获取需要进行搜索的内容,其中信息服务器包括了场景模块162、预测模块164与搜索模块166,场景模块可以在使用个人信息之前,定对正在分析的信息并进行加密,以去除用户的实际身份信息,这些信息是和用户相关联的搜索历史、位置历史、购买信息等。
场景模块通过输出由场景模块维护的、指定计算设备的当前场景的数据来传输数据至预测模块。预测模块通过事先的学习,来预测用户通过查询想要搜索内容的意图,例如用户经常搜索与糖尿病有关的信息,则可以推断用户很有可能自身或者身边的人患有糖尿病而在网络上寻求相关信息的帮助。
搜索模块则维护着用户的搜索历史,这些搜索历史是可以排布以及可以进行搜索的,搜索模块可以向场景模块和预测模块提供对搜索历史的分析数据以及历史输出信息,这些信息将有助于预测模块进行更加精准的用户意图分析。
如上图,为预测与搜索查询相关联的意图以及基于该意图来调整搜索结果的计算系统示意图,其中可以看到,主要是处理器、通信单元以及存储设备之间进行数据交互,而在存储设备中包含由场景模块、预测模块、搜索模块以及训练模块。除此之外,还包括有日志数据存储库、场景历史数据存储库和意图规则数据存储库这样三个数据库,用来存放数据。
日志数据存储主要由搜索模块和场景模块维护,其中记录着不同类型的数据日志,例如地图数据、流视频数据以及查询数据,这些日志往往是在用户进行搜索服务时产生,因此可以根据这些信息来分析用户的搜索规则。
场景历史数据存储包括部分日志数据以及可组织、可搜索的历史场景信息,这些信息包含位置信息、时间信息、传感器信息、用户的兴趣信息、有关设备操作状态的信息、应用执行信息以及预测模块使用搜索查询预测用户的需求和推断搜索意图的信息。
意图规则数据则包括了由系统制定的规则以及用户可能完成搜索任务需要的信息,预测模块就是根据这些规则来针对当前的场景预测用户可能会搜索的信息内容,而这些预测则是利用人工智能算法进行推断。
最后我们再来看看预测和搜索查询相关联的信息搜索流程图,在搜索的开始,信息服务器将接收一组用户输入的日志数据,此时场景模块就会存储当前的每个相关联的场景信息,例如位置、时间、等具有场景特性的信息。
在信息服务器接收到用户的搜索查询后,预测模块可以确定细化场景以便于搜索更加准确的用户意图,例如用户输出“希腊”,倘若结合用户的位置信息,处于希腊机场时,则信息服务器可以给出当天由希腊出发的航班信息,再结合天气等信息,就可以达到智能化的搜索服务,之后信息服务器再将所查询得到的内容返回给计算机。
当计算机接收到来自信息服务器的搜索结果后,可以调整搜索结果以调整满足用户意图的信息,从而使得搜索结果更加显著以及符合用户需求。
以上就是谷歌发明的信息搜索系统,该系统可以基于用户意图来调整从搜索返回的搜索结果,使得搜索结果可以满足用户的意图,这种在搜索过程中动态调整的算法在现有的搜索系统中还是比较少见,现有的方法常常利用模糊搜索等搜索方法来使得搜索内容更加精准以及使用更高效率的查找算法来减少用户的等待时间,而谷歌发明的这种搜索方法则可以达到智能化的搜索效果,更加贴合用户习惯。
(校对/holly)