【文章导读】:1、知识图谱是人工智能 (AI) 以及人类知识发展的基础支柱之一,是对人、物、位置、事件和概念等实体的相互关联世界的真实描述,为数据集成、管理和分析提供框架。
随着关联数据、人工智能以及数据分析日益发展,知识图谱技术的应用不断增加,成为各个行业业务的主流需求。IDC预测,全球 65%的GDP将实现数字化,2022年至2023年将推动超过6.8万亿美元的支出。而到2023年,亚太地区20%的商业智能将整合知识图谱。
Neo4j知识图谱寻找隐藏在复杂关联事件中的模式,在更短的间隔内以可扩展的方式从具有复杂上下文情景的大量数据中获取有价值的信息,用户可以对基础数据进行推理并自信地使用其进行复杂的决策。
 
2、整体而言,数据科学家并不喜欢数据库,他们更加钟爱数据。而图数据库是个例外,越来越多的数据科学家对图数据库青睐有加。数据科学家使用图形算法处理数据,再通过图将数据输入机器学习管道中,从而为机器学习模型和预测提供关系型信号。由此,图数据库成为机器学习管道中的核心部分。
不同于关系型数据库,图数据库以事物的连接方式为中心,强调数据之间的关联关系,它将数据间的联系视为和数据本身同等重要。图数据平台让用户能够在图数据库上开发和运行应用程序,它直接将关系和数据在物理层面上一并存储下来,使得访问数据结点和关系的操作能够以线性时间复杂度完成。在普通PC机上的测试结果表明,Neo4j图数据库的查询引擎能够在一秒内轻松遍历百万级的关系/边。
 
 
 
 
知识图谱赋能企业数字化转型
 
 
 
 
 
 
 
作者:Neo4j大中华区总经理方俊强
 
相互关联是大数据时代的鲜明特征。激增且日益复杂的海量数据正通过各种方式对企业发展产生重要影响。如何正确理解和解读数据,发掘其内在价值,从而推动企业的智能决策备受关注。
 
在当今的商业世界或者日常生活中,无论是企业还是个人都自觉或不自觉地使用知识图谱,将解决问题的想法和过程相互关联。知识图谱技术可以让其更加明确,为实现智能决策的数字化经济提供支持和保障。
 
知识图谱是人工智能 (AI) 以及人类知识发展的基础支柱之一,是对人、物、位置、事件和概念等实体的相互关联世界的真实描述,为数据集成、管理和分析提供框架。
 
随着关联数据、人工智能以及数据分析日益发展,知识图谱技术的应用不断增加,成为各个行业业务的主流需求。IDC预测,全球 65%的GDP将实现数字化,2022年至2023年将推动超过6.8万亿美元的支出。而到2023年,亚太地区20%的商业智能将整合知识图谱。
 
Neo4j知识图谱寻找隐藏在复杂关联事件中的模式,在更短的间隔内以可扩展的方式从具有复杂上下文情景的大量数据中获取有价值的信息,用户可以对基础数据进行推理并自信地使用其进行复杂的决策。
 
Neo4j知识图谱将智能融入数据,显著提升整体价值,用例从管理遍布到分析乃至机器学习,使人工智能/机器学习获得更好的预测,连接数据孤岛,为数据结构和数字孪生等创新应用奠定基础。
Neo4j知识图谱的应用极其广泛,覆盖网络安全、金融服务、医疗保健、生命科学、供应链和物流、零售、电信和制造等众多行业,适用于从欺诈检测和实时推荐到患者旅程、数字孪生、材料清单等各种用例。以下将以网络安全、医疗和电信行业为例做具体介绍。
 
整合网络事件,强化网络安全
亚太地区,中国、澳大利亚和新加坡的联邦及中央政府在网络安全方面的支出处于领先地位。到2025年,他们在增强网络安全的智能解决方案上的投资将超过7.24 亿美元。
网络世界正在快速发展,恶意软件世界也是如此。IT和OT系统(数据库、门户网站、边缘设备、操作系统等)可能受到潜在攻击而发生异质性变化,从而使网络安全任务变得更加复杂。知识图谱能够整合网络安全相关事件,并且可以通过机器学习方法进一步加以利用。
 
发现隐藏模式,支持个性医疗
临床知识图谱是一个开源平台,包含大约2000万个节点和2.2亿个可用实验数据、公共数据和文献之间的关系。其规模不断扩大,允许使用统计分析和机器学习来提高生物医学研究的效率,例如生物标志物研究。知识图谱加快了对生物标志物、个体基因和代谢过程之间关联的探索,以支持个性化医疗的发展。
 
2020 年,中国长沙的医院与四所中国大学合作,研究肿瘤生物标志物的药物不良反应 (ADR)。知识图谱应用于现有文献,连接肿瘤、生物标志物、药物和 ADR 之间的关联。结果在临床实验中得到验证,证实了比传统的共现方法更好的模型性能,支持进一步决策。
 
智能电信网络,应对复杂运营
亚太区的电信公司预计在2022年将花费超过5.84亿美元用于网络优化和预防性维护。电信公司在越来越复杂的供应商生态系统中运营,服务必须跨各种硬件和环境进行交互。这给电信支持团队带来了重大问题,因为多供应商支持需要更高的能力来理解技术层之间的交互。
 
物联网和边缘设备的激增继续在网络拓扑中产生变化,使得进行故障诊断和实施基于规则的策略变得越来越困难。知识图谱可以帮助电信公司捕获和对流程、子网络、设备和事件进行建模,以识别单点故障并支持SDN。
 
越来越多的公司将在数字优先经济中面临全新的挑战,需要以更大的敏捷性扩展解决方案流程。Neo4j知识图谱是一个非常全面、丰富而且成熟的产品,包括负责数据存储的Neo4j图数据库,致力数据分析的图数据科学 (GDS) 以及负责数据挖掘和探索的数据可视化工具Neo4j Bloom。作为图数据平台的领导者,Neo4j的企业愿景就是在不同的行业场景,帮助客户深入分析高度关联的复杂数据,使业务数据变为商业智能,提高数据的应用价值,赋能企业智能决策和数字化转型。
 
 
 
 
 

 

 

Neo4j CEO Emil Eifrem 解读图数据平台引领数据库未来十年的发展

 

 

(ChinaIT.com讯)萌芽于20世纪60年代的数据库技术在刚刚兴起的十年并没有大行其道。而在过去短短的十年,信息世界快速发展,面临极其复杂、互联、动态、不断变化的数据洪流,数据库平台如雨后春笋般涌现,市场上的选择增加到 350 多个。多年来,数据库市场都以每年5 %至6%的速度高速扩张,市场体量未来4到5年有望从现在的500 亿美元攀升至 1,000 亿美元。
 
过去两年,数据库行业的发展趋势呈现三大特征。
 
首先是融合,随着新型数据的大规模创新,高速扩展的数据库市场再次呈现出融合的局面,数百家数据库厂商逐渐归入到包括文档数据库、图数据库、时序数据库、NewSQL数据库在内的四个全新且稳定的数据库阵营中。在不同细分领域中,仅有有限的几家公司在领军之路上引吭高歌,如图领域的Neo4j 和文档领域的 MongoDB。
 
第二,向云转移成为整个行业的长期趋势。2017年前后一些大型云供应商和独立云供应商开始涌现。虽然曾因数据重力和监管等因素的影响进展放缓,而今这一趋势再次气势如虹。数据向云服务转移在很大程度上成为数据库平台的发展驱动要素。
 
第三,数据科学家方兴未艾。整体而言,数据科学家并不喜欢数据库,他们更加钟爱数据。而图数据库是个例外,越来越多的数据科学家对图数据库青睐有加。数据科学家使用图形算法处理数据,再通过图将数据输入机器学习管道中,从而为机器学习模型和预测提供关系型信号。由此,图数据库成为机器学习管道中的核心部分。
 
以供应链为例,10 年前供应链应用并不是图数据库的最佳用例。因为在当时任何生产实物产品的制造公司可能只拥有一个 2 到 3 个级别的供应链,关系型数据库完全能满足企业的需求。如果需要分析,加入2至3个节点即可。
时至今日,制造业企业不仅业务分布广泛,横跨不同大陆,而且还要应对此起彼伏的突发事件,制造业企业需要了解这种事件对供应链乃至业务产生的影响,拥有确保供应链安全的能力,行之有效的解决方案就是实现供应链数字化。如今,企业面临的数据分析不再是 2至3次的跳转挖掘,而是 20、30甚至40次跳转挖掘。数据库尤其是在多次跳转方面表现卓越的图数据库成为必然之选。
 
不同于关系型数据库,图数据库以事物的连接方式为中心,强调数据之间的关联关系,它将数据间的联系视为和数据本身同等重要。图数据平台让用户能够在图数据库上开发和运行应用程序,它直接将关系和数据在物理层面上一并存储下来,使得访问数据结点和关系的操作能够以线性时间复杂度完成。在普通PC机上的测试结果表明,Neo4j图数据库的查询引擎能够在一秒内轻松遍历百万级的关系/边。
 
未来十年,将是图数据平台成为主流并大放异彩的十年,这不仅引起了行业专家对图技术的重新思考,对于开发人员而言也是一件幸事。开发者驱动是Neo4j的文化,Neo4j的成功离不开对开发者生态的建设。Neo4j重视对开发者的投资并致力为开发者服务,除了定期举办培训、会议等各种活动,还出版大量相应的技术书籍,来辅助开发者不断成长。
 
自2018年起Neo4j就活跃在中国市场。如今,Neo4j 的业务足迹遍布北京、上海和深圳并与业内合作伙伴建立了良好的关系。今年6月,Neo4j在F轮风险投资中获得3.25亿美元的融资,创造了私营数据库公司单笔最高融资纪录,投后估值超过20亿美元。除了继续投资图数据库和数据科学外,Neo4j还将重点扩展中国市场,帮助越来越多的中国企业通过图数据平台来挖掘数据的价值。