在图神经网络中完整的图可能非常大以至于GPU显存放不下,此时对大图进行采样就显得非常重要了,这里介绍GraphSAGE中提出的一种子图采样技术。
假设采样的层数为,每层采样的邻居数为,GraphSage中邻居采样是这样进行的:
-
步骤一:首先给定要采样邻居的小批量节点集;
-
步骤二:对的跳(hop)邻居进行采样,然后得到,然后对的跳邻居进行采样(即最初结点集的跳邻居)得到,如此往复进行次,得到最初小批量节点集相关的一个子图。
下图左是GraphSage中给出的一个2层邻居采样的示例,其中每层采样的邻居数S_k是相等的(图中为3)。