请问王老师,关于知识抽取相关问题

课时3的内容非常多,花了几次时间反复听讲,收获丰富,再次感谢王老师。
但也有部分地方有些疑惑,恳请老师答疑:
1、实体链接,通过上下文消岐过程中,若用监督学习的神经网络方法,local centext我能理解,一般是从前后上下词或者位置等信息做模型的embedding输入。老师提到Global context信息,只针对topic近似匹配么?
2、实体关系的联合抽取,似乎从参数共享方面的联合抽取方法还是两个子任务,即先NER,再根据NER预测信息进行两两匹配做关系的分类,那对于一句文本或一段文本,存在多个实体的情况,冗余变大怎么破?联合抽取也不能产生新的关系?
3、事件抽取,pipeline方法,转换为多阶段的分类问题,其中对argument role的分类问题,给定event和argument组成多分类问题这,老师能再细讲一下?FrameNet extraction 是抽取的这里的argument role?
谢谢老师回答

王昊奋 - 知识图谱从业者

赞同来自: fish 威6gp 任之dwl

1. 实体链接中的global context主要是整个输入文本的信息,因为Local context只是当前mention周围固定范围内的词来帮助做实体消歧,而global context则是当前输入文本的各种信息,最简单容易想到的就是文本的领域分类结果,或各种主题标签,所以这里就举了通过topic modeling(如LDA)得到的结果来帮助消歧,这可以和entity type进行匹配。   2. joint inference这里主要是将NER或实体链接的结果和关系抽取(一般是relation classification)的优化目标综合考虑成为包含两个串行任务的新的优化目标,从而使得抽取的实体以及实体之间的语义关系识别整体准确率最高。联合抽取首先是不会产生新的关系的,因为他的关系抽取的任务和pipeline形式的是一致的。联合学习模型往往模型参数会变大,搜索空间同时考虑两个任务,使用一些共享来使得整体的参数会小于两个任务的参数和。存在多个实体的情况下,本来关系抽取就是给定一个实体对,判断他们之间是否有给定的语义关系(多分类);joint inference主要是避免因为实体识别错误导致去判断错误实体对之间的语义关系,存在多个实体对于pipeline和joint没有关系。   3. role argument classification就是给定一个argument,和事先定义好的多个role(与event对应的),这本质上就是一个多分类问题,即有n个role,则就是n+1分类问题,来判断当前argument是属于两个role或一个都不属于。比如我有一个flight_booking的事件,存在from和to两个role(或slot),我有一句话:“我住在上海,想订一张从深圳到北京的机票”这里就有3个类别是LOCATION的arguments:上海,深圳,北京,然后通过role argument classification,3分类,那么上海:NIL,深圳:from,北京:to。FrameNet本身就是一个以Frame理论(见第二讲中的早期知识表示)的一个标注数据库,通过这个来扩充原来ACE语料库中的数据,这里包含argument的提取,也报告argument和role的对应关系两个步骤。

要回复问题请先登录注册