详细讲解wordembedding

常给自己加个油 常给自己加个油     2022-11-30     529

关键词:

机器经过阅读大量的words,将每个单词用vector表示,vector的dimension表达着这个单词的属性,意思相近单词,dimension就会呈现出来。vector就是word embedding。

 

 

为了表示每个单词之间有联系,用二维vector来表示单词。可以更直观的看出每个单词的所属的类或者具有某种共同点。

 

 

machine 在学习这俩个词语的时候,了解到都有520宣誓的字样,所以他认为他俩的vector应该相似。

 

 

根据上下文来找到vector,有以下俩种方法。
Count 找到一组V(wi)V(wj)进行内积计算之后与他俩在文章里出现的次数Nij作比较最相近的。

 

 

 

 

Prediction based 给机器input词汇,让机器训练一个网络能够输出下一个,output vector dimension由世界上可以出现的词汇数目决定。用Minmizing cross entropy 让output与target(指的就)接近,进行调参,找到最适合的neural network。

 

 

 

 

推文接话就是用的prediction方法。

 

 

 

 

prediction 句子出现的概率,Neural network是推文接龙网络,直接拿来进行预测。output 出现下一个target单词的概率,之后一起进行相乘。(这种技术用于speech recognition和机器翻译)。

 

 

每一个word vector 乘以 matrix(相当于进行降维或者linear transformation
操作)得到由z1,z2等等组成的vector输入神经网络hidden layer中,几个隐藏层不等,最后输出下一个word的概率也是vector。 下边坐标图将每一个word vector的z1,z2…提取到坐标中,然后就可以看出同样的word有相近的特性。 这已经是learning好的network。

 

 

下边解释为什么learning好的network输出vector。只有一个hidden layer的,并且是linear activate fuction。
为什么用shall netwrok呢?
第一:因为有大量word vector的时候shall network train的快,并且效果和DNN是一样的。
第二:提取的线性变换之后的word vector(就是坐标轴中的vector)来当做NLP(自然语言处理)的input。

 

 

tie一起就是权值共享,不管你输入的word vector多长,w都不变的,参数不增加,可以一次输入十个或者二十个vector,计算z公式如下,之后再让之后的layer来寻找下一个预测的wi。

相同颜色的共用一个weight,减少了参数,并且不同位置的相同的word vector经过线性变换能够得到相同的word embedding。每一组词汇有固定的word embedding。

各种各样的prediction如下:

 

 

 

 

 

其他的例子关系

 

 

 

 

 

推论问题的例子:
机器进行如下计算并且推论出word w。

 

 


用绿色的英文与中文learning transform,之后将黄色的英文丢到learning好的transform中。就会在相应的最接近的中文旁边。

 

 

 

 

 


用Bag-word描绘那篇文,每一dimension代表某词汇出现的次数。丢到network中输出word embedding。

 

 

词的数目bag-word一样但是顺序不一样,表达的语义不一样。

 

 


获取以上文本PPT请点击这里
————————————————
版权声明:本文为CSDN博主「一双单眼皮」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_44479403/article/details/103466928

wordembedding理解

一直以来感觉好多地方都吧WordEmbedding和word2vec混起来一起说,所以导致对这俩的区别不是很清楚。 其实简单说来就是wordembedding包含了word2vec,word2vec是wordembedding的一种,将词用向量表示。1.最简单的wordembedding是把词进行基于... 查看详情

fiddler的界面详细讲解

一.fiddler首页概述  查看详情

python基础:元组的详细讲解

文章目录元组的详细讲解一、元组的应用场景二、定义元组三、元组的常见操作 查看详情

wordembeddings:encodinglexicalsemantics(代码片段)

WordEmbeddings:EncodingLexicalSemanticsGettingDenseWordEmbeddingsWordEmbeddingsinPytorchAnExample:N-GramLanguageModelingExercise:ComputingWordEmbeddings:ContinuousBag-of-WordsWordEmbeddingsinPytorchim 查看详情

wordembedding的通俗解释

**WordEmbedding是NLP中最频繁出现的词了,关于wordembedding,其实很简单。wordembedding的意思是:给出一个文档,文档就是一个单词序列比如“ABACBFG”,希望对文档中每个不同的单词都得到一个对应的向量(往往是低维向... 查看详情

java大数详细讲解

介绍java中用于操作大叔的类主要有俩种第一个是BigInteger,代表大整数。第二个是BigDecimal,代表大浮点数。两种类的操作方法类似,所以我们只讲解BigInterger的用法基本用法Scannerinput=newScanner(System.in);BigIntegera=input.nextBigInteger();Big... 查看详情

有没有wpfmvvm框架的详细讲解?

参考技术AProWPFandSilverlightMVVM可惜是英文版的 查看详情

docker镜像详细讲解(代码片段)

...cromaple来源|CSDN博客前言大家好,本文是对Docker镜像的详细讲解,讲解了如何安装Docker、配置Docker镜像加速以及操作Docker镜像。希望对大家有所帮助~安装Docker1.1CentOSDocker 要求 CentOS 系统的内核版本高于3.10,查看本页... 查看详情

iptables详细参数讲解

table表-->chain链--->rule规则Commands:Eitherlongorshortoptionsareallowed.--append-Achain添加规则到链上[!]--proto-pproto指定过滤的协议tcpudpicmpall[!]--source-saddress[/mask][...]指定源地址[!]--destination-daddress[/ma 查看详情

详细讲解nfs网络文件存储系统配置

详细讲解NFS网络文件存储系统配置-----------------------------------------------NFS优点--------------------------------NFS(NetworkFileSystem)即网络文件系统,是FreeBSD支持的文件系统中的一种,它允许网络中的计算机之间通过TCP/IP网络共享资源。... 查看详情

python基础(十三):集合的详细讲解(代码片段)

文章目录集合的详细讲解一、创建集合二、集合常见操作方法1、增加数据2、删除数据3、查找数据集合的详细讲解一、创建集合创建集合使用或set(),但是如果要创建空集合只能使用set(),因为用来创建空字典。s1=10,20,... 查看详情

transform详细讲解

 CSS32DTransform详细讲解 #文章CSS3css3动画 在一个二维或三维空间,元素可以被扭曲、移位或旋转。只不过2D变形工作在X轴和Y轴,也就是大家常说的水平轴和垂直轴;而3D变形工作在X轴和Y轴之外,还有一个Z轴。这些3D变... 查看详情

云原生docker镜像详细讲解(代码片段)

前言大家好,本文是对Docker镜像的详细讲解,讲解了如何安装Docker、配置Docker镜像加速以及操作Docker镜像。希望对大家有所帮助~目录前言一、安装Docker1.1、CentOS1.2、Ubuntu二、Docker镜像加速器2.1、Ubuntu14.04、Debian7Wheezy2.2、U... 查看详情

pytorchnote40词嵌入(wordembedding)(代码片段)

PytorchNote40词嵌入(wordembedding)文章目录PytorchNote40词嵌入(wordembedding)词嵌入PyTorch实现Skip-Gram模型模型结构全部笔记的汇总贴:PytorchNote快乐星球词嵌入前面讲了循环神经网络做简单的图像分类问题和飞机流... 查看详情

python基础:列表的详细讲解(代码片段)

文章目录列表的详细讲解一、列表的应用场景二、列表的格式三、列表的常用操作1、查找2、增加3、删除4、修改5、复制四、列表的循环遍历1、while2、for五、列表嵌套六、总结列表的详细讲解一、列表的应用场景思考:有⼀... 查看详情

springmvc构造restful详细讲解

/blog/1 HTTP GET =>  得到id = 1的blog/blog/1 HTTP DELETE => 删除 id = 1的blog/blog/1 HTTP PUT =>  更新id = 1的blog/blog   HTTP POST =>  新增BLOG     以下详细解一下springrest使用.  查看详情

typescript超详细讲解(代码片段)

...,如果大家有时间的话可以学习一下老师的课程,讲的非常详细,如果时间不充裕的话,请看如下文章,进行学习https://www.bilibili.com/video/BV1Xy4y1v7S2?p=10、TypeScript简介TypeScript是JavaScript的超集。它对JS进行了扩展,向JS中引入了类型... 查看详情

springboot自动装配原理详细讲解(清楚明白)

注意看代码加的中的注解1.启动类上因为加上了@EnableEurekaServer这个注解才可以实现自动装配@SpringBootApplication@EnableEurekaServerpublicclassEurekaApplicationpublicstaticvoidmain(String[]args)SpringApplication.run(EurekaApp 查看详情