关键词:
论文阅读|DeepWalk: Online Learning of Social Representations
文章目录
Abstract
DeepWalk概括了语言模型和无监督特征学习(或深度学习)从单词序列到图形的最新进展。 DeepWalk 使用从截断的随机游走中获得的局部信息,通过将游走视为句子的等价物来学习潜在表示。
Introduction
上图是将karate_klub社交网络编码嵌入后社区结构之间的对应关系。
论文贡献如下:
- 引入深度学习作为分析图的工具,以构建适用于统计建模的稳健表示。deepwalk使用很短的随机游走来学习图的结构规律。
- 在标签稀疏性的网络上,显著提高了分类性能,Micro-F1指数提高了5%-10%。某些情况下,减少60%训练数据也有很好的表现。
- 并实现行构建网络表示证明算法的可扩展性。
Problem Definition
- 图 G = ( V , E ) G = (V,E) G=(V,E)
- G L = ( V , E , X , Y ) G_L=(V,E,X,Y) GL=(V,E,X,Y)是部分标记的社交网络, X ∈ R ∣ V ∣ × S X∈R^|V|×S X∈R∣V∣×S,S是每个属性向量的特征空间的大小, Y ∈ R ∣ V ∣ × ∣ y ∣ Y∈R^|V|×|y| Y∈R∣V∣×∣y∣,y是标签集
论文中提出了一种不同的方法来捕获网络拓扑信息。 它没有将标签空间混合作为特征空间的一部分,而是提出了一种无监督的方法,该方法学习捕获独立于标签分布的图结构的特征。
结构表示和标记任务之间的分离避免了在迭代方法中可能发生的级联错误。
- 目标是学习 X E ∈ R ∣ V ∣ × d X_E∈R^|V|×d XE∈R∣V∣×d,其中d是少量的潜在维度
Learning Social Representations
从以下几个方面来考虑社区学习:
- 适应性:社会关系不因网络的发展而变化
- 社区意识:一定的维度距离下网络中成员之间的社会相似性
- 低维:当数据标记稀缺时,低维模型可以更好地泛化,并加速收敛和推理
- 连续:潜在表征模拟连续空间中的部分社区成员
随机游走(Random Walks):以节点 v i v_i vi为根的随机游走表示为 W v i ⋅ W_vi· Wvi⋅
幂率(Power laws):单词出现的频率遵循幂率,若图中节点遵循幂率,则随机游走时邻居节点的出现也遵循幂率
语言模型(Language Modeling):语言建模的目标是估计特定单词序列在语料库中出现的可能性。准确说就是给定一个单词序列 W 1 n = ( w 0 , w 1 , ⋅ ⋅ ⋅ , w n ) W_1^n=(w_0,w_1,···,w_n) W1n=(w0,w1,⋅⋅⋅,wn),其中 w i ∈ V , V w_i∈V,V wi∈V,V是词汇表,我们希望最大化 P r ( w n ∣ w 0 , w 1 , ⋅ ⋅ ⋅ , w n − 1 ) Pr(w_n|w_0,w_1,···,w_n-1) Pr(wn∣w0,w1,⋅⋅⋅,wn−1)。
将此模型应用到网络中(节点即为单词),显然有
P
r
(
v
i
∣
(
v
1
,
v
2
,
⋅
⋅
⋅
,
v
i
−
1
)
)
Pr(v_i|(v_1,v_2,···,v_i-1))
Pr(vi∣(v1,v2,⋅⋅⋅,vi−1))
我们的目标是学习潜在表示,而不仅仅是节点共现的概率分布,因此引入了映射函数
Φ
:
v
∈
V
→
R
∣
V
∣
×
d
\\Phi:v∈V→R^|V|×d
Φ:v∈V→R∣V∣×d。其中$\\Phi $表示与图中每个顶点v相关联的潜在社会表示。此时,问题变成了概率
P
r
(
v
i
∣
(
Φ
(
v
1
)
,
Φ
(
v
2
)
,
⋅
⋅
⋅
,
Φ
(
v
i
−
1
)
)
)
Pr(v_i|(\\Phi (v_1), \\Phi(v_2),···,\\Phi(v_i-1)))
Pr(vi∣(Φ(v1),Φ(v2),⋅⋅⋅,Φ(vi−1)))
使用单词来预测内容的语言模型,在建模上产生了优化问题,即最小化
m
i
n
i
m
i
z
e
−
l
o
g
P
r
(
(
v
i
−
w
,
⋅
⋅
⋅
,
v
i
+
w
)
v
i
∣
Φ
(
v
i
)
)
minimize \\quad -logPr( ( v_i-w,···,v_ i+w) \\ v_i|Φ(v_i))
minimize−logPr((vi−w,⋅⋅⋅,vi+w) vi∣Φ(vi))
Method
DeepWalk
其中
- γ \\gamma γ表示每个节点的随机游走次数
- O = s h u f f l e ( V ) : O=shuffle(V): O=shuffle(V):每次打乱节点的目的是:加快随机梯度下降的收敛速度
SkipGram
- skipgram语言模型,可最大化窗口内单词的共现频率
- 使用分层softmax来近似概率分布,如下图中
c
所示。
代码第三行计算成本很高,所以使用Hierarchical softmax。顶点分配给二叉树的叶子,将预测问题转化为最大化层次结构中特定路径的概率。如果到顶点
u
k
u_k
uk的路径由一系列树节点
b
0
,
b
1
,
⋅
⋅
⋅
,
b
∣
l
o
g
∣
V
∣
∣
,
(
b
0
=
r
o
o
t
,
b
∣
l
o
g
∣
V
∣
∣
=
u
k
)
b_0,b_1,···,b|log|V||,(b_0=root,b|log|V||=u_k)
b0,b1,⋅⋅⋅,b∣log∣V∣∣,(b0=root,b∣log∣V∣∣=uk),则 如何阅读论文李沐1.第一遍:文章主要讲什么1.1看整体1.2看图表2.第二遍:文章每一部分讲什么3.第三遍:真正读懂吴恩达1.1系统阅读论文集1.2论文至少要看三遍1.2.1第一遍,仔细阅读论文中的标题、摘要和关键词... 查看详情 sig论文阅读记录LettherebeColor!:JointEnd-to-endLearningofGlobalandLocalImagePriorsforAutomaticImageColorizationwithSimultaneousClassification(siggraph2016)论文简介论文主页:http://hi.cs.waseda.ac.jp/~iizuka/p 查看详情 HMER论文系列1、论文阅读和分析:WhenCountingMeetsHMERCounting-AwareNetworkforHMER_KPer_Yang的博客-CSDN博客2、论文阅读和分析:Syntax-AwareNetworkforHandwrittenMathematicalExpressionRecognition_KPer_Yang的博客-CSDN博客3、论文阅读和分析:ATree-Stru... 查看详情 MADDPG论文阅读:论文阅读|《Multi-AgentActor-CriticforMixedCooperative-CompetitiveEnvironments》(NeurlPS,2017)(MADDPG)1论文1[1]Wang,,Shengyi,Duan,,Jiajun,Shi,,Di,Xu,,Chunlei,Li,,Haifeng,Diao,,Ruisheng,Wang,, 查看详情 ...。现在的主要工作就是在OCR文字识别,期间也看了不少的论文,从CTPN到FasterRCNN,再到EAST和FOTS。最开始因为刚接触这个领域,很多名词看不懂,论文阅读非常吃力,后来随着知识的积累和深入,现在阅读也变得轻松起来。最近... 查看详情 论文阅读|DeepWalk:OnlineLearningofSocialRepresentations文章目录论文阅读|DeepWalk:OnlineLearningofSocialRepresentationsAbstractIntroductionProblemDefinitionLearningSocialRepresentationsMethod实验设置RelatedWork我的看法参考资 查看详情 TowardsFacilitatingEmpathicConversationsinOnlineMentalHealthSupport论文阅读笔记(一)文章目录TowardsFacilitatingEmpathicConversationsinOnlineMentalHealthSupport论文阅读笔记(一)一,本篇定位二 查看详情 ...wtoReadaPaper-StanfordUniversity 摘要?我们花费大量时间阅读论文,但是如何读论文这种技能却很少被教,导致会有些人因为不正确的方式浪费的很多时间和精力。本文概述了一种实用且有效的【三遍】方法用于阅读论文,它可以防... 查看详情 文章目录如何进行写作05.22如何进行写作 查看详情 文章目录如何进行写作05.22如何进行写作 查看详情 VaswaniA,ShazeerN,ParmarN,etal.Attentionisallyouneed[C]//AdvancesinNeuralInformationProcessingSystems.2017:5998-6008.文章提出纯粹基于attention的NNmodel:Transformer。theTransformeristhefirsttransductionmodelrely 查看详情 [论文阅读]UtilizingBERTforAspect-BasedSentimentAnalysisviaConstructingAuxiliarySentence[论文阅读]UtilizingBERTforAspect-BasedSentimentAnalysisviaConstructingAuxiliarySentence 查看详情 ...在YouTube上的演讲:对职业发展的一些建议以及阅读研究论文的方法Andrew提出的主要建议:重视论文阅读:这是非常重要的技巧。当他试图在深度学习中掌握一个新主题时,他就会阅读科研论文。具体的步骤是:编写一份论文列... 查看详情
P
r
(
u
k
∣
Φ
(
v
j
)
)
=
∏
l
=
1
l
o
g
∣
V
∣
P
r
(
b
l
∣
Φ
(
v
j
)
)
Pr(u_k|\\Phi (v_j))=\\prod_l=1^log|V|Pr(b_l|\\Phi (v_j))
Pr(uk∣Φ(vj))=l=1∏log∣V∣Pr(bl∣Φ(vj))
此时,
P
r
(
b
l
∣
Φ
(
v
j
)
)
Pr(b_l|\\Phi(v_j))
Pr(bl∣Φ(vj))可以通过分配给节点
b
l
b_l
bl的父节点的二分类器建模,
P
r
(
b
l
∣
Φ
(
v
j
)
)
=
1
/
(
1
+
e
−
Φ
(
v
如何阅读论文
论文阅读记录:automaticimagecolorizationsig16
论文阅读和分析:hybridmathematicalsymbolrecognitionusingsupportvectormachines
论文阅读|用于不同问题的maddpg算法框架系列论文汇总
想要接触人工智能吗?先要学会如何阅读论文
论文阅读|deepwalk:onlinelearningofsocialrepresentations(代码片段)
towardsfacilitatingempathicconversationsinonlinementalhealthsupport论文阅读笔记
如何阅读论文
书籍阅读-科技论文写作
书籍阅读-科技论文写作
#论文阅读#attentionisallyouneed
[论文阅读]utilizingbertforaspect-basedsentimentanalysisviaconstructingauxiliarysentence
吴恩达关于论文阅读的建议
pp-yoloe论文阅读
yolo-stream论文阅读
yolo-stream论文阅读
yolo-pose论文阅读
yolo-pose论文阅读