知识图谱落地应用
· 2020-04-03 14:34:07 · 北京瑞铭安普科技有限公司知识图谱落地
建立一套知识的模型
如何获取知识
如何做好知识的融合如何实现知识的存储
如何保证知识的计算
高效地开展知识应用知识获取
知识表示
知识存储
知识应用
-
检索模式。在已经建立好的现成知识库图谱的基础上,我们将需要理解或翻译的句子,放到库里进行“答案”检索,再通过语义分析来进行匹配。最终将匹配出来的结果反馈给用户。可见,这是一种理解自然语言的常用场景。
-
混合模式。在检索模式的基础上,我们添加了深度自我生成的模型,以应对在知识库或语义库的匹配效果不佳的情况下,利用 RNN(循环神经网络)和 LSTM(长短期记忆网络)来生成智能模型。
-
通过百度搜索、Word 文件、PDF 文档或是其他类型的文献,抽取出非结构化的数据。
-
通过自然语言处理技术,使用命令实体识别的方式,来识别出文章中的实体,包括:地名、人名、以及机构名称等。
-
通过语义相似度的计算,确定两个实体或两段话之间的相似程度。
-
通过同义词构建、语义解析、依存分析等方式,来找到实体之间的特征关系。
-
通过诸如 TF-IDF 和向量来提取文本特征,通过触发事件、分词词性等予以表示。
-
通过 RDA(冗余分析)来进行主题的含义分析。
-
使用数据库或数据表进行数据存储。
-
针对所提取出来的文本、语义、内容等特征,通过知识本体的构建,实现实体之间的匹配,进而将它们存放到 Key-Value 类型的数据库中,以完成数据的映射和本体的融合。
-
当数据的体量过大时,使用 Hadoop 和 Spark 之类的分布式数据存储框架,再通过 NoSQL 的内容将数据存过去。
-
当需要进行数据推理或知识图谱的建立时,再从数据中抽取出各类关系,通过各种集成规则来形成不同的应用。
- 2018-11-20
- 下一篇:知识图谱落地应用场景