当前位置: 首页 > news >正文

【IE】信息抽取任务简述

1 信息抽取任务

信息抽取(Information extraction,IE)任务指从非结构化或半结构化的文本中抽取出结构化信息。根据被抽取的对象,信息抽取可以分为以下4个任务:
(1) 实体抽取(Entity)
(2) 关系抽取(Relation)
(3) 事件抽取(Event)
(4) 情感抽取(Sentiment)
IE任务的应用背景:
(1) 互联网的蓬勃发展,捕获互联网上的舆情信息成为了需求
(2) 数据挖掘兴起后,产生了和语言文字相关的数据挖掘任务

1.1 实体抽取任务

定义:从预定语义类型(如人名、地点、组织等)的文本中识别特定类型指定物的任务。
任务
(1) 指代消解任务(Anaphora resolution),关注句子中的指代关系。

  • 找出指代关系
    在这里插入图片描述
  • 补充代词
    在这里插入图片描述

(2) 共指消解(Co-references),关注一段文本中不同的命名实体,和所有的代表这些实体的词语。
在这里插入图片描述
(3) 与知识图谱相关的任务:实体链接,实体规范化。

1.2 关系抽取任务

定义:识别句子中命名实体间的特定关系。
任务:构建知识图谱

1.3 事件抽取任务

定义:事件有不同类型,从文本中抽取事件需要关注不同的触发词(trigger word)。一个事件,除了触发词,还有相应的事件论元,如在“访问”事件中,有访问者、被访问者等属性。
任务
(1) 事实性检测:判断事件的可信度
(2) 事件时间顺序推断:自动抽取、恢复事件间原有的先后发生顺序
(3) 事件因果检测:从文本中推断事件的因果关系
(4) Script Learning:从大量文本中自从抽取整体的事件框架(script)知识的任务

1.4 情感抽取任务

任务:讽刺检测、情感词典构建、立场检测、情绪检测

链接1:https://zhuanlan.zhihu.com/p/571220239
链接2:https://www.bilibili.com/video/BV1kQ4y1r7ft/?spm_id_from=333.337.search-card.all.click&vd_source=2aa81cd07cc344789f94654b8878ab57

相关文章:

  • 二苯并环辛炔-聚乙二醇-生物素DBCO-PEG-Biotin简介 DBCO-PEG-Biotin衍生物可以在没有金属催化剂(铜离子)作用下发生点击化学反应
  • C#个人珍藏基础类库分享 — 9、基本排序算法类SortHelper
  • Pytest用例运行及先后顺序
  • Adobe 2023全家桶12月版本更新
  • 【Linux】---文件基础I/O(上)
  • DOM生成图片原理
  • 笔记本怎么录制屏幕?只需2分钟,快速学会
  • Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition
  • 【C++11】可变参数和lambda表达式
  • 基于鸽群算法改进的DELM预测 -附代码
  • uni-app 微信支付-小程序、APP、IOS
  • 等保2.0参与医院网络安全管理的重要性
  • 以数据赋能业务,qlik为企业搭建透明绩效管理平台
  • [ Linux ] 死锁以及如何避免死锁
  • JavaScript时间格式化插件,返回指定字符串
  • 多播网络(Multicast)应用权限
  • 使用mosquitto部署MQTT服务
  • Zookeeper 4 Zookeeper JavaAPI 操作 4.7 Curator API 常用操作【Watch 事件监听】
  • 【发表案例】计算机科学类SCI,仅1个月零6天录用,涵盖软件、信息、数据云计算、网络、建模等研究方向
  • 【JavaScript】15_debug,立即执行函数 与 严格模式