论文泛读186qa数据集爆炸:用于问答和阅读理解的nlp资源分类

及时行樂_ 及时行樂_     2022-12-15     721

关键词:

贴一下汇总贴:论文阅读记录

论文链接:《QA Dataset Explosion: A Taxonomy of NLP Resources for Question Answering and Reading Comprehension》

一、摘要

近年来,除了对 NLP 中的深度学习模型进行大量研究外,还对跟踪建模进度所需的基准数据集进行了大量工作。问答和阅读理解在这方面特别多产,在过去两年中出现了 80 多个新数据集。这项研究是迄今为止对该领域最大的调查。我们概述了当前资源的各种格式和领域,突出了未来工作的当前空白。我们进一步讨论了当前问答中“推理类型”的分类,并提出了新的分类法。我们还讨论了过度关注英语的影响,并调查了当前单语资源对其他语言和多语种资源的影响。

二、想法

很好的分析了一些近年来的数据集,感觉对选取合适的数据集进行实验很有帮助。

论文泛读190基于子图搜索的在线问答系统

贴一下汇总贴:论文阅读记录论文链接:《AnOnlineQuestionAnsweringSystembasedonSub-graphSearching》一、摘要知识图(KG)已广泛用于问答(QA)应用程序,尤其是基于实体的QA。然而,从整个大规模知识图中搜索答案非常耗时,... 查看详情

论文泛读190基于子图搜索的在线问答系统

贴一下汇总贴:论文阅读记录论文链接:《AnOnlineQuestionAnsweringSystembasedonSub-graphSearching》一、摘要知识图(KG)已广泛用于问答(QA)应用程序,尤其是基于实体的QA。然而,从整个大规模知识图中搜索答案非常耗时,... 查看详情

论文泛读162问答系统中答案验证的联合模型

贴一下汇总贴:论文阅读记录论文链接:《JointModelsforAnswerVerificationinQuestionAnsweringSystems》一、摘要本文研究了在前几名中选择正确答案句的联合模型。克由回答句选择(AS2)模块提供,这些模块是基于检索的问答(QA)系... 查看详情

论文泛读63弱监督的开放域问答中的潜在检索(orqa-开放检索问答)

贴一下汇总贴:论文阅读记录论文链接:《LatentRetrievalforWeaklySupervisedOpenDomainQuestionAnswering》一、摘要关于开放域问答(QA)的最新工作假设对支持证据的严格监督和/或假设使用黑匣子信息检索(IR)系统来... 查看详情

论文泛读184dyplodoc:用于文档分类的动态图

贴一下汇总贴:论文阅读记录论文链接:《DYPLODOC:DynamicPlotsforDocumentClassification》一、摘要叙事生成和分析仍处于现代自然语言处理的边缘,但在各种应用中都至关重要。本文提出了一种地块动态特征提取方法。我们... 查看详情

论文泛读184dyplodoc:用于文档分类的动态图

贴一下汇总贴:论文阅读记录论文链接:《DYPLODOC:DynamicPlotsforDocumentClassification》一、摘要叙事生成和分析仍处于现代自然语言处理的边缘,但在各种应用中都至关重要。本文提出了一种地块动态特征提取方法。我们... 查看详情

论文泛读168对训练数据进行重复数据消除会使语言模型变得更好

贴一下汇总贴:论文阅读记录论文链接:《DeduplicatingTrainingDataMakesLanguageModelsBetter》一、摘要我们发现现有的语言建模数据集包含许多几乎重复的示例和长重复的子字符串。结果,在这些数据集上训练的语言模型的自... 查看详情

论文泛读168对训练数据进行重复数据消除会使语言模型变得更好

贴一下汇总贴:论文阅读记录论文链接:《DeduplicatingTrainingDataMakesLanguageModelsBetter》一、摘要我们发现现有的语言建模数据集包含许多几乎重复的示例和长重复的子字符串。结果,在这些数据集上训练的语言模型的自... 查看详情

论文泛读163用于推文中情绪检测的模糊粗略最近邻方法

贴一下汇总贴:论文阅读记录论文链接:《Fuzzy-RoughNearestNeighbourApproachesforEmotionDetectioninTweets》一、摘要社交媒体是有意义数据的重要来源,可用于不同的任务,例如情感分析和情感识别。大多数情况下,这些... 查看详情

论文泛读163用于推文中情绪检测的模糊粗略最近邻方法

贴一下汇总贴:论文阅读记录论文链接:《Fuzzy-RoughNearestNeighbourApproachesforEmotionDetectioninTweets》一、摘要社交媒体是有意义数据的重要来源,可用于不同的任务,例如情感分析和情感识别。大多数情况下,这些... 查看详情

unsupervisedquestionansweringbyclozetranslation

...xff1a;PatrickLewis发布地方:arXiv面向任务:问题生成论文地址:https://arxiv.org/abs/1906.04980论文代码:GitHub-facebookresearch/UnsupervisedQA:UnsupervisedQuestionansweringviaClozeTranslation目录摘要1介绍2无监督抽取式QA2.1上下文和答案生... 查看详情

论文泛读195pgcd:用于基于方面的情感分析的位置引导贡献分布单元

贴一下汇总贴:论文阅读记录论文链接:《PGCD:aposition-guiedcontributivedistributionunitforaspectbasedsentimentanalysis》一、摘要基于方面的情感分析(ABSA),探索方面给定句子的情感极性,在社交媒体和舆论中得到了... 查看详情

论文泛读195pgcd:用于基于方面的情感分析的位置引导贡献分布单元

贴一下汇总贴:论文阅读记录论文链接:《PGCD:aposition-guiedcontributivedistributionunitforaspectbasedsentimentanalysis》一、摘要基于方面的情感分析(ABSA),探索方面给定句子的情感极性,在社交媒体和舆论中得到了... 查看详情

论文阅读2021中国法研杯司法考试数据集研究(cail2021)(代码片段)

...已完成的工作,事实上原作者是将司法考试任务视为阅读理解任务来评估的,其中使用到ElasticSearch\\textElasticSearchElasticSearch检索以及多级推理等技术,这意味着该任务的解决思路将会十分开阔,但是该任务本身的... 查看详情

论文泛读183用于小样本文本分类的元学习对抗域适应网络

贴一下汇总贴:论文阅读记录论文链接:《Meta-LearningAdversarialDomainAdaptationNetworkforFew-ShotTextClassification》一、摘要元学习已成为解决少样本文本分类并实现最先进性能的趋势技术。然而,现有的解决方案严重依赖于对... 查看详情

论文泛读183用于小样本文本分类的元学习对抗域适应网络

贴一下汇总贴:论文阅读记录论文链接:《Meta-LearningAdversarialDomainAdaptationNetworkforFew-ShotTextClassification》一、摘要元学习已成为解决少样本文本分类并实现最先进性能的趋势技术。然而,现有的解决方案严重依赖于对... 查看详情

论文泛读197带有注意力的textcnn用于文本分类

贴一下汇总贴:论文阅读记录论文链接:《TextCNNwithAttentionforTextClassification》一、摘要绝大多数文本内容都是非结构化的,这使得自动分类成为许多应用程序的一项重要任务。文本分类的目标是将文本文档自动分类为... 查看详情

论文泛读197带有注意力的textcnn用于文本分类

贴一下汇总贴:论文阅读记录论文链接:《TextCNNwithAttentionforTextClassification》一、摘要绝大多数文本内容都是非结构化的,这使得自动分类成为许多应用程序的一项重要任务。文本分类的目标是将文本文档自动分类为... 查看详情