随着数字化、网络化、智能化的到来,通过互联网、物联网采集到的数据呈现爆炸式的增长。其中,文本、图片、音频、视频等无法用统一结构表示的非结构化数据,在海量数据中占据越来越高的比例。
数据是新基建的关键生产要素。明略科技首席科学家吴信东认为,知识图谱技术有助于提升数据的生产要素效能,助力新基建价值最大化。
什么是知识图谱?通俗地说,就是把所有不同种类的信息连接在一起而得到的一个语义关系网络。它的一个特点,就是可以抽取实体关系、事件、标签、模型、规则等条件,形成以图为基础的数据形式。和一般的数据存储形式的区别在于,知识图谱“保存”有推理规则和专家经验,不仅仅能用数据反映事件,还能反映出事件之间的联系。
吴信东打个比方,当车辆出现故障无法启动,资深维修专家用小锤头敲两三次,根据声音判断就可能知道哪一个部件出了问题。新手则会把可能出问题的部件都拆开来检查,尝试所有的可能。知识图谱相当于人工智能时代的行业专家。
“以前大家使用数据,只关注最终得出的结果,过程中的数据分析、计算等‘洞察力’并没有积累下来,也就无法分享、复用这种经验。”吴信东说,人工智能需要实现从感知到认知的能力跨越。知识图谱是目前与人类大脑思维本质最趋近的人工智能底层技术,可通过实体、关系、事件挖掘实现对客观世界的认知,并且由已有的知识产生新的知识。
目前,知识图谱作为知识的一种形式,已经在语义搜索、智能问答、数据分析、自然语言理解、视觉理解、物联网设备互联等多个方面发挥越来越大的作用。在新冠肺炎疫情防控中,技术人员通过知识图谱技术,快速搭建了疫情防控图谱分析研判系统,为抗疫提供大数据支撑。
吴信东介绍,在人工智能领域,营销智能国家新一代人工智能开放创新平台就是聚焦消费者动态变化的个性化、碎片化需求,用基于行业知识图谱的知识推理与服务技术,帮助企业从多源异构的海量数据中发现业务规律,建立从研发、生产、营销、销售到服务的完整智能商业闭环,实现精准洞察、实时决策和高效运转。
在推动制造业升级和发展工业互联网领域,基于知识图谱的解决方案,可形成完整的智能服务平台,有效降低对人的依赖程度。例如,结合知识图谱与机器学习技术,可以搭建针对地铁车辆故障维修的远程诊断辅助决策系统,帮助售后部门远程诊断并提供维修建议,通过这一系统,企业能够加速和扩大维修经验的积累和分享。
吴信东认为,图谱化将是企业进行数据管理的未来趋势,知识图谱能够连接上游大数据和下游人工智能应用任务,从而更有效地把数据转化成为真正的行业知识,满足行业应用需求。
《 人民日报 》( 2020年07月20日 19 版)