基于机器学习的领域特定命名实体识别(NER)?

     2023-03-12     96

关键词:

【中文标题】基于机器学习的领域特定命名实体识别(NER)?【英文标题】:ML based domain specific named enitty recognition (NER)? 【发布时间】:2012-04-16 18:39:41 【问题描述】:

我需要构建一个分类器来识别特定域中的 NE。因此,例如,如果我的域是 Hockey 或 Football,分类器应该接受该域中的 NE,但不是它在网页上看到的所有代词。我的最终目标是通过 NER 改进文本分类。

对于从事该领域工作的人,请建议我应该如何构建这样的分类器? 谢谢!

【问题讨论】:

【参考方案1】:

如果您只想忽略代词,您可以运行任何 POS 标记器,然后运行任何 NER 算法(Stanford 包是一种流行的实现),然后忽略任何作为代词的命名实体。但是,代词可能指的是命名实体,这可能对分类器的性能很重要,也可能不重要。唯一可以确定它尝试的方法。

一个稍微不相关的评论 - 一个在特定领域数据(例如曲棍球)上训练的 NER 系统更有可能从该领域中提取实体,因为它会看到一些上下文实体出现在其中。根据系统的不同,它由于语法、词形模式等原因,也可能会从其他域中提取实体(如果我正确理解您的问题,您不想要这些)。

【讨论】:

我想做的是真正基于NER的网页分类。这就是为什么我选择了像 Hoeky、Football(不是运动)这样的缩小域。因此,我希望分类器识别该域上的代词(球员姓名、团队、物品制造公司等,它们都可能相关),但不是所有代词。 续。分类器可以挑选一些不相关的实体,因为没有分类器具有 100% 的精度。我不明白 NER 算法后面的 POS 标记器如何忽略你提到的代词。我想我想要的是你在“稍微无关的评论”中提到的;是的,分类器应该研究实体出现的上下文。所以我必须通过手动创建这些实体的列表来收集训练数据,对吧? 我提到的 POS 标记器不适用于 NER 分类器(尽管 POS 标记是有用的功能)——它是用于您的后处理的。在 NE 标记之后,我建议您删除所有 POS 标记为 PP 的命名实体。 感谢您的回答。你能给我推荐一些有用的链接来阅读这个吗?我已经通过 StanfordNER 和 LingPipe NERecognizer 有没有比这更好的? 我想再次进入你。 :) 假设我在特定网页中提取了 NE。正如我所提到的,我的最终目标是通过 NE 改进文本分类。那么,如果我使用 NE 数量(PERS=x,LOC = y,ORG=z)作为特征以及普通文本(文档)分类特征,以提高分类精度,是否可以?你觉得这样好吗?【参考方案2】:

我认为像AutoNER 这样的东西可能对此有用。本质上,系统的输入是来自特定域的文本文档和您希望系统识别的特定域实体的列表(例如您的曲棍球运动员)。

根据他们在this paper 中的结果,他们在识别化学名称和疾病名称等方面表现良好。

【讨论】:

一文详解深度学习在命名实体识别(ner)中的应用

...应用3.1语料准备3.2数据增强3.3实例4.总结近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别࿰... 查看详情

一文详解深度学习在命名实体识别(ner)中的应用

...应用3.1语料准备3.2数据增强3.3实例4.总结近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别࿰... 查看详情

用keras+lstm+crf的实践命名实体识别ner(代码片段)

...别这样的序列标注任务自然也是不例外的,早就有了基于LSTM+CRF的深度学习实体识别的相关研究了,只不过与我之前的方向不一致,所以一直没有化太多的时间去关注过它,最近正好在学习NER,在之前的相... 查看详情

机器不学习:浅析深度学习在实体识别和关系抽取中的应用

机器不学习jqbxx.com-机器学习好网站命名实体识别(NamedEntityRecognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型,如下图。命名实体识别是NLP领域中的一些复杂任务的基础问题,诸如自动问答,关... 查看详情

浅析深度学习在实体识别和关系抽取中的应用

...间相互之间存在着不同种类的关系。NER的研究从一开始的基于词典和规则的方法,基于统计机器学习的方法,到近年来基于深度学习的方法,NER研究的进展趋势如下图所示。基于统计机器学习的方法主要包括:隐马尔... 查看详情

学习--基于深度学习命名实体识别综述

ASurveyonDeepLearningforNamedEntityRecognitionhttps://arxiv.org/abs/1812.09449命名实体识别(NamedEntityRecognition,NER)是指从自由文本中识别出属于预定义类别的文本片段。NER任务最早由第六届语义理解会议(MessageUnderstandingConference)提出,当时仅... 查看详情

simpleandeffectivefew-shotnamedentityrecognitionwithstructurednearestneighborlearning

参考技术A我们提出了一个基于最近邻学习和结构化推理的简单few-shot命名实体识别(NER)系统。我们的系统使用在源域上训练的监督NER模型作为特征提取器。在多个测试域中,我们发现在这个特征空间中的最近邻分类器比标准的... 查看详情

论文解读:acl2021ner|基于模板的bart命名实体识别

摘要:本文是对ACL2021NER基于模板的BART命名实体识别这一论文工作进行初步解读。本文分享自华为云社区《ACL2021NER|基于模板的BART命名实体识别》,作者:JuTzungKuei。论文:CuiLeyang,WuYu,LiuJian,YangSen,ZhangYue.TemplateBasedN... 查看详情

基于统计的中文实体识别方法简述

...任务必不可少的组成部分。 NER方法大致可分为两类:基于规则的方法和基于统计的方法。基于规则的方法多采用语言学家手工构造规则模板, 查看详情

cs224d单隐层全连接网络处理英文命名实体识别tensorflow

...词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,作为结构化信息提取的重要步骤。NER具体任务1.确定实体位置2.确定实体类别给一个单词,我们需要根据上下文判断,它属于下面四... 查看详情

stanfordcorenlp命名实体识别ner学习笔记(代码片段)

简介识别文本的命名实体,如人名和机构名称等。每种语言识别出的实体是相互独立的,英文的识别集合比其他语言更为丰富。再NERClassifierCombiner中,会执行多个命名实体识别,然后将结果组合起来。识别类别  ... 查看详情

政治领域的命名实体识别

】政治领域的命名实体识别【英文标题】:NamedEntityRecognitioninpoliticaldomain【发布时间】:2012-02-2902:19:55【问题描述】:对于我的文本分类研究项目,我需要识别政治领域中的命名实体(使用NER来改进文本分类)。我在哪里可以找... 查看详情

机器学习-命名实体识别之hiddenmarkovmodelling(代码片段)

概述命名实体识别在NLP的应用中也是非常广泛的,尤其是是informationextraction的领域。NamedEntityRecognition(NER)的应用中,最常用的一种算法模型是隐式马可夫模型(HiddenMarkovModelling)-HMM。本节内容主要是通过介绍HMM的原理,以及应... 查看详情

命名实体识别(ner)算法(代码片段)

文章目录标注方案问题建模评价指标常用的NER方法深度学习方法(insurvey)输入的分布式表示上下文编码解码器实践Bert+SoftmaxBert+CRF参考在论文ASurveyonDeepLearningforNamedEntityRecognition中对NER工作进行了详尽的介绍。本文... 查看详情

领域图谱之命名实体识别-namedentityrecognitionusingasemi-supervisedmodelbasedonbertandbootstrapping(代(代码片段)

目录背景研究思路实验总结背景1.这篇文章中提出了一种基于BERT和Bootstrapping半监督模型来进行命名实体识别。首先说一下在命名实体识别方面的背景。命名实体识别是关系抽取、事件抽取、知识图谱等诸多NLP任务的基础。技术... 查看详情

命名实体识别---入门

...NamedEntityRecognition,后文简称NER)是指从文本中识别具有特定类别的实体(通常是名词),例如人名、地名、机构名、专有名词等。命名实体识别是信息检索,查询分类,自动问答等问题的基础任务,其效果直接影响后续处理的... 查看详情

如何改进hanlp命名实体识别

...名实体识别的性能。参考技术A1.增加数据量:由于HanLP是基于深度学习的命名实体识别,数据量的多寡对最终的结果有很大的影响。所以增加更多的数据,比如更丰富的文本,更多类型的实体,这将有助于HanLP模型的改进。2.改进... 查看详情

命名实体识别 (NER) 功能

】命名实体识别(NER)功能【英文标题】:Namedentityrecognition(NER)features【发布时间】:2017-06-1912:06:10【问题描述】:我是命名实体识别的新手,在理解此任务中使用什么/如何使用功能时遇到了一些麻烦。到目前为止,我读过的一些... 查看详情