二阶相似性
二阶相似性适用于有向或者无向图(比如Deepwalk里面就用到了有向的二阶相似性) , 二阶相似性假定与其他顶点共享邻居顶点的两个点彼此相似(无向有向均可) , 一个向量u和u'分别表示顶点本身和其他顶点的特定“上下文” , 意为二阶相似 。 对于每个有向边(i,j) , 我们首先定义由生成“上下文”的概率:
模型优化
由于O2的计算代价十分的昂贵 , 因此目标函数优化时使用了负采样方法 , 为每条边指定了一个目标函数:
实验分析与展示与Deepwalk中的实验类似 。
数据集
语言网络:基于英文维基百科页面构建词共同网络社交网络:Flickr、Youtube引用网络:作者和论文引文网算法
GFDeepwalkLINE-SGD , LINELINE(1st+2nd):
对于所有方法 , 随机梯度下降的小批量大小设置为1;以起始值p0=0.025和pt=p0(1-t)设定学习速度 , T是小批量或边缘样品的总数;为了公平比较 , 语言网络嵌入的维度被设置为200;而其他网络中 , 默认设置为128;其他的默认参数设置包括:LINE的负采样k=5 , 样本总数T=100亿(LINE),T=200亿(GF) , 窗口大小win=10 , 步行长度t=40 , 对于DeepWalk , 每顶点行走y=40;所有的嵌入向量最终通过设置||w||2=1进行归一化 。
语言网络
评估学习嵌入的有效性:词类比和文档分类 。
词类比:给定一个单词对(a,b)和一个单词c , 该任务旨在找到一个单词d , 使得c
和d之间的关系类似于a和b之间的关系 。
社交网络
与语言网络相比 , 社交网络更加稀缺;将每个节点分配到一个或多个社区的多标签分类任务来评估顶点嵌入;随机抽取不同百分比的顶点进行训练 , 其余用于评估 。 结果在10次不同运行中进行平均 。 下面是在Flickr和Youtube数据集上的结果展示 。
通过GF和LINE两种方法对引用网络进行评估 。 还通过多标签分类任务评估顶点嵌入 。 我们选择7个流行会议 , 包括AAAI , CIKM , ICML , KDD , NIPS , SIGIR和WWW作为分类类别 。
稳定性
推荐阅读
-
逗儿妈妈男孩说出一番话,让母亲哑口无言,6岁男孩挑食被母亲呵斥
-
【iPhone】面对疫情,苹果公布新政策,除中国市场,果粉可享140元补贴
-
「微信」微信“新规定”确认,两大功能不再免费,网友:逼我放弃?
-
华为mate▲华为P50Pro概念图:这就是四曲真全屏,比华为Mate40更值得期待
-
海外网|旅美大熊猫美香幼崽体重曝光 性别将在数周后公布
-
硬拳大卫君|印度官员依旧云淡风轻,国际权威雷霆发声,灾难性局面已经酿成
-
河南省|刚喝完“秋天的第一杯奶茶”,第一家同名公司就成立了?
-
中国足球|李霄鹏:蒿俊闵伤情比较严重,或缺席鲁能此后比赛
-
PAPI最时尚|你喜欢的品牌在什么位置呢,腕表王国官位表
-
爱疯电子峰哥苹果史上最耐用的手机,虽降价幅度大,但市场份额不降反增
-
三体|真实感扑面而来,炸裂震撼!《流浪地球2》绝不辜负你我的期待
-
-
-
营收|中国纸巾“第一品牌”,年营收225亿,维达和洁柔都不是对手
-
花朵|3种花人见人爱,植株低矮小巧,花开一整年,超级好养
-
水镜晓先生|俄3万吨潜艇启动测试,可引发超级海啸吞没城市,威力远超核导弹
-
「搞笑男人心」加入双电侧滑门,1.5T+7DCT,7.98万起,别克GL8碰到对手
-
张艺谋|《满江红》中五个谋女郎均没有以往的惊艳感,张艺谋看走眼了?
-
-