关于知识图谱ID的问题

老师好,现在我想做一个支持推理的领域知识图谱,有没有必要将唯一ID弄成URI的形式,还是通过传统的数值id或者字符串形式的id。因为考虑到知识图谱本身的存储就是多源异构的,所以想问问老师用URI形式的ID有没有有必要,有哪些好处呢,谢谢老师。

王昊奋 - 知识图谱从业者

赞同来自: 爱的阿达 fish

弄成URI是为了可以对外发布,让浏览器或外部API可以通过URI来访问到相关的信息,类似我们输入URL来访问HTML网页一样,并支持基于typed link(各种关系)来导航到其他对象。所以如果你是一个后台的使用,包括查询,推理等,为了简单期间都仅需要唯一标识的ID即可。当然我们之前也说过,ID如何来确定呢?首先需要是唯一确定的unique,其次需要和URI之间有一个对应关系,所以URI一般为了让大家可读,都会写成domain/resource_type/local_name这样的形式,比如http://dbpedia.org,resource以及Shanghai分别ID化(通过某种如哈希的映射)如果返回是10000,10,340这样的long" rel="nofollow" target="_blank">http://dbpedia.org/resource/Shanghai,就是一个可以segmented的结构化良好的资源URI的表示。通过这个URI,我们用浏览器访问,可以得到对应的页面,都是Shanghai的介绍。那么我们可以进一步使用这个来进行ID化,比如domainID_resourceTypeID_localNameID,这里就由http://dbpedia.org,resource以及Shanghai分别ID化(通过某种如哈希的映射)如果返回是10000,10,340这样的Long int来表示,就可以得到这个对应的ID是10000_10_340了。希望这个例子可以帮助你理解。

要回复问题请先登录注册