《一种策略融合的跨语言文本情感倾向判别方法》论文学习笔记(大一下)

Flippedkiki Flippedkiki     2022-09-03     204

关键词:

现象:因特网资源呈现多语言化和跨语言的特点,给普通用户获取非母语网络信息造成障碍。

 

目标:整合多语言倾向信息,以通用的数据形式让用户了解多语言数据对某个对象的评价。

 

针对跨语言情感倾向分类任务,提出两种跨语言情感倾向分析策略:

  1. 半监督框架的跨言情感倾向判别方法(双语协同文本情感倾向判别框架)

关键:跨语言一致文本

 

材料:源语言数据集和目标语言数据集

 

目标:利用源语言数据集的情感倾向标签,预测目标语言数据集中未标注样本点的情感倾向标签,即学习跨语言函数。

 

方法:将情感倾向一致样本点作为载体,采用半监督学习方法在源语言和目标语言候选特征的并集中,建立情感倾向一致的表示空间。

 

具体步骤:

(1)源语言和自动翻译后的目标语言分别采用Fisher特征选择判别模型得到高度置信样本。

(2)选择高度置信样本点(源语言和目标语言共享的情感倾向观点词,同时包含部分目标语言常使用而源语言较少使用的情感倾向观点词)。

(3)将高度置信样本点(目标语言上的情感倾向观点词)逐步加入训练数据集中。

(4)将源语言和目标语言的训练数据集通过Fisher特征选择判别模型得出两种语言的判别结果。

(5)融合两种语言判别结果时,需要平衡目标语言和源语言判别结果的置信度。采用置信度加权叠加方式计算双语融合置信度L(x)(若L(x))=0。则x为正面情感倾向,反之为负面情感倾向)

 

2.跨语言特征混合文本情感倾向判别框架

关键:跨语言混合概念空间

 

材料:带有情感倾向标注的源语言训练数据集、未标注目标语言数据集

 

目标:用跨语言情感倾向特征混合压缩的思想,提取跨语言情感倾向特征。

 

方法:将数据集映射到概念空间中,从而叠加原始特征信息,解决共享特征和样本点稀少的问题

 

具体步骤:

(1)源语言和目标语言进行数据处理后,得到一致语言训练数据。

(2)主成分分析(PCA):训练数据经过PCA跨语言特征混合后,选择一定数量的主成分作为混合特征空间,其维度远小于输入原始维度。 (减小了数据在高维空间中的稀疏性)。

(3)在混合正交表示空间后,得到混合空间训练数据和混合空间目标数据。

(4)源语的混合空间训练数据运用三种机器学习后,得到判别模型。

(5)用判别模型对混合空间目标数据进行倾向判别,得出最后的判别结果。

 

3.融合两种框架判别结果,给出文本整体情感倾向性(跨语言文本情感倾向判别有效)

具体步骤:

(1)数据预处理:语言翻译、去停用词、词语校准(对齐误拼单词)

(2)分别采用两种跨语言倾向判别框架,得到特征混合策略结果(result1、result2)

(3)通过样本整体置信度计算公式,将两种策略最终判别结果融合。

 

4.结论与展望

(1)今后应从跨语言情感倾向概念空间结构以及多种语言到情感倾向概念空间的变换结构继续深入开展研究。

(2)对于多策略方法融合而言,有效的融合集成需要基分类器具有有效性和鸡分类器之间必要的差异性。

 

【论文笔记】融合标签向量到bert:对文本分类进行改进

...究已经进一步提高了它们的性能。在本文中,作者提出了一种简洁有效的方法,在保持几乎相同的计算成本的情况下,利用标签嵌入技术来提高BERT的文本分类性能。在6个文本分类基准数据集上的实验结果证明了其有效性。文本... 查看详情

短文本情感分析

...为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。情感极性分析的目的是对文本进行褒义、贬... 查看详情

论文|一种基于embedding和mapping的跨域推荐方法

迁移学习(TransferLearning)作为机器学习的一大分支,已经取得了长足的进步。在人工智能领域,无论是图像识别、NLP、搜索推荐都离不开迁移学习的身影。迁移学习的核心问题是找到源域和目标域的某种相似性&#x... 查看详情

论文|一种基于embedding和mapping的跨域推荐方法

迁移学习(TransferLearning)作为机器学习的一大分支,已经取得了长足的进步。在人工智能领域,无论是图像识别、NLP、搜索推荐都离不开迁移学习的身影。迁移学习的核心问题是找到源域和目标域的某种相似性&#x... 查看详情

nlp文本情感分析(代码片段)

...计算研究。文本情感分析(SentimentAnalysis)是自然语言处理(NLP)方法中常见的应用,也是一个有趣的基本任务,尤其是以提炼文本情绪内容为目的的分类。它是对带有情感色彩的主观性文本进行分析、处... 查看详情

红外与可见光图像融合论文阅读

...orinfraredandvisibleimages,这里记录一下。Abstract本文提出一种残差融合网络residualfusionnetwork(RFN),用于替换传统的融合方法,同时提出两种损失函数用于训练RFN:细节保留损失函数和特征增强损失函数。模型训练使用... 查看详情

红外与可见光图像融合论文阅读

...orinfraredandvisibleimages,这里记录一下。Abstract本文提出一种残差融合网络residualfusionnetwork(RFN),用于替换传统的融合方法,同时提出两种损失函数用于训练RFN:细节保留损失函数和特征增强损失函数。模型训练使用... 查看详情

自然语言处理①(代码片段)

文章目录自然语言处理概述自然语言理解自然语言生成文本情感分析统计学方法统计学方法的局限性SDK实现文本情感分析百度智能云控制台创建自然语言处理应用到底什么是SDK情感倾向分析接口自然语言处理概述自然语言处理&#x... 查看详情

towardsemotionalsupportdialogsystems论文笔记

...三)情感支持的范例(四)情感支持中的八大策略三,情感支持数据集四,方法、实验和结果(一)方法(二ÿ 查看详情

towardsemotionalsupportdialogsystems论文笔记

...三)情感支持的范例(四)情感支持中的八大策略三,情感支持数据集四,方法、实验和结果(一)方法(二ÿ 查看详情

实训第七天

...为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。情感极性分析的目的是对文本进行褒义、贬... 查看详情

论文泛读187使用bert基于阿拉伯语方面的情感分析

...ntimentanalysisusingBERT》一、摘要基于方面的情感分析(ABSA)是一种文本分析方法,它定义了与特定目标相关的某些方面的观点的极性。关于ABSA的大部分研究是用英语进行的,少量工作是用阿拉伯语进行的。大多数先前的阿拉... 查看详情

论文泛读187使用bert基于阿拉伯语方面的情感分析

...ntimentanalysisusingBERT》一、摘要基于方面的情感分析(ABSA)是一种文本分析方法,它定义了与特定目标相关的某些方面的观点的极性。关于ABSA的大部分研究是用英语进行的,少量工作是用阿拉伯语进行的。大多数先前的阿拉... 查看详情

红外与可见光图像融合论文阅读

...rk,和上次博文是同组,这里分享一下。本文提出一种深度学习方法融合可见光和红外图像的模型,首先将源图像分解为基部和细节部,然后基部用加权平均方法融合,细节部使用深度学习框架提取多层特征&#x... 查看详情

红外与可见光图像融合论文阅读

...rk,和上次博文是同组,这里分享一下。本文提出一种深度学习方法融合可见光和红外图像的模型,首先将源图像分解为基部和细节部,然后基部用加权平均方法融合,细节部使用深度学习框架提取多层特征&#x... 查看详情

文本情感分析:基于词袋模型(vsmlsan-gram)的文本表示(代码片段)

...情感分析的题目,我会整理做特征工程、参数调优和模型融合的方法,这一系列会有四篇文章。这篇文章整理文本特征工程的内容。文本的特征工程主要包括数据清洗、特征构造、降维和特征选择等 查看详情

像素级压缩感知图像融合的论文

...,从仿真结果来看效果并不是很好,仅做介绍。 2012一种基于小波稀疏基的压缩感知图像融合算法针对图像小波分解系数特点,提出了一种基于双放射状采样模式的压缩传感域图像融合算法。该算法首先通过双放射状采样模... 查看详情

bilstm默认激活函数

...的全称是LongShort-TermMemory,它是RNN(RecurrentNeuralNetwork)的一种。LSTM由于其设计的特点,非常适合用于对时序数据的建模,如文本数据。BiLSTM是Bi-directionalLongShort-TermMemory的缩写,是由前向LSTM与后向LSTM组合而成。两者在自然语言... 查看详情