网络表示学习
- 网络表示的关键问题:
如何定义图中节点的相似性
图神经网络及认知推理
网络上的学习任务:
- 节点分类:给定一个点,预测其类别
- 链接预测:给2个点,预测这2个点是否相连
- community detection:找子图
- 网络相似度:2个网络或子网络的相似度
回顾网络表示学习
给定一个网络,学习节点的低维表示,如果2个节点距离很近,那这2个节点的表示也要相似。
挑战:
- CNN只适用于网格(二维),但是网络是一个拓扑机构
- RNN适用于文本/序列,这种都有先后关系,但是网络没有先后关系
- 网络是动态的,节点有属性,并且网络还有结构属性
网络表示学习发展:
- 使用word2vec来做网络表示学习,即DeepWalk
- 根据DeepWalk进行扩展:
- LINE:一阶和二阶相似性
- PTE:异构网络
- Node2vec:biased random walk
网络表示学习的本质:
都是在做矩阵分解,SVD分解,只是分解的形式不一样。
图表示学习结合的是context信息,用上下文信息来做网络表示学习。
问题:
GNN
异质图
同质网络:网络中只有一种类型的节点或边
异质网络:网络中有多类节点或边
首先分解出网络中的对象,以及对象之间的关系。
例如:作者-论文-会议,一个网络中有3类节点。
其中对象之间的关系(Meta path)有:
- 作者1-论文-作者2(2个作者共同合作一篇论文)
- 作者1-论文-引用论文1,作者1写论文,引用了其他论文
- ……
模型
- Metapath2Vec
基于meta path的随机游走, - HERec
解决异质图中节点的表示,将异质图变成同质图,在同质图中用DeepWalk或LINE学习节点表示 - HIN2Vec
随机游走抽取出点边序列 - MCRec