知识图谱图数据库选型
· 2020-04-03 14:19:37 · 北京瑞铭安普科技有限公司知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱图数据库选型
-
数据的体量。由于我们公司有着两亿规模的日活数据量,而且还会持续产生无数个节点,因此我们需要选用一款能够支持大体量数据的数据库。
-
开源的属性。如今 Neo4j 的企业版已经不再开源。而就算它以前的开源模式也并不完全。由于其核心内容并未开源,因此一旦出现了问题,我们很难得到及时的支持与帮助。
-
是否支持分布式。鉴于上述企业版的限制,有人曾提出采用免费的版本。可是,由于只有企业版的 Neo4j 才能支持分布式存储与集群,而且其免费版无法支撑我们的数据体量,因此我们后续没有再去考虑 Neo4j。
-
落地时的性能。其间,我们还曾经对比过 Dgraph 与 Cayley。鉴于两者都是开源型的数据库,且都能够支持分布式,因此我们考量了它们的第三个维度:落地时的性能。
我们曾经使用上亿的数据量,去分别检验两种数据库查找关系和建立关系的性能。
随后,我们发现由于自身存在着 Bug,Dgraph 对于支持边的权重计算存在着缺陷,会导致在进行边与边、点与点的计算时出现性能上的问题。
因此经过综合考虑,我们最终还是选用了 Cayley 作为自己的图数据库。当然,我们也将自己的发现提交给了 Dgraph 的作者,如今的 Dgraph 版本,已经修正了该 Bug。
- 2022-07-01
- 下一篇:知识图谱落地应用