The problem of GNNs:
- 传统GNN会被1-WL test 所限制。因为节点都是以度进行区分的。
- 核心问题:节点分类或者连接预测并不是同构问题,但是GNN是基于WL-test的所以必须要给节点引入特征。
- 传统的WLtest会根据节点的度来区分节点,就会导致无法区分结构信息
- 在这里做两层卷积会导致节点信息都是相同,无法直接区分两个节点之间是否有连边。
- 全图分类会有无法区分
Distance Encoding:
- 采用最短路径作为特征,可以区分节点同构
- 同时也可以解决链接预测的问题。对每个pair都对图中的所有节点算最短距离。
对于全图的预测来说
对每个节点都进行标记,然后就能区分
- 采用one-hop标记,dimension最大是要卷积的距离,比如最大距离是4,则有4为0000,比如有两个节点到他的距离分布是2和3,则最后距离嵌入表示是0110,如何有两个节点是距离为4则是0002,以此类推。
- 得到feature就把它拼接到原始节点上进行卷积
证明:
- 对于层数不断增加,则区分度更好。
实验:
- 实验是在以节点周围结构为准的图来进行判断。