图机器学习——5.11 图神经网络：网络训练与数据集划分

Kanny广小隶

于 2022-05-24 22:28:01 发布

阅读量3.9k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：图机器学习深度学习学习笔记文章标签：机器学习神经网络人工智能 GNN 图神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41929524/article/details/124931152

学习笔记同时被 3 个专栏收录

48 篇文章

订阅专栏

26 篇文章

订阅专栏

图机器学习

22 篇文章

订阅专栏

这篇博客探讨了图神经网络中的训练方法，包括基于有监督的节点、边和图标签训练，以及无监督的节点、边和图水平训练。训练过程涉及交叉熵和均方误差等损失函数，并介绍了数据集的划分方式，如transductive和inductive setting。此外，还讨论了图数据集划分的特殊性及其在不同任务中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

网络训练

整体的训练可以分为基于有监督的标签训练，及无监督的训练。

有监督训练可以有如下标签：
- 基于节点标签 $y_v$ ：如引文网络中，节点属于哪个学科领域；
- 边标签 $y_{uv}$ ：如交易网络中，边缘是否欺诈；
- 图标签 $y_{G}$ ：如分子图中，图的药物相似度。
无监督训练：
- 节点水平 $y_v$ ：如聚类系数、PageRank、…；
- 边水平 $y_{uv}$ ：如隐藏两个节点之间的边，预测是否应该有链接；
- 图水平 $y_{G}$ ：如预测两个图是否同构。

为了训练网络，我们需要有明确的损失函数，其实这些损失函数与常用深度学习中的损失函数是一致的。例如：针对分类问题可以用交叉熵（Cross Entropy）；针对回归问题可以用均方误差（Mean Squared Error）。只是样本标签的具体构造需要根据实际的任务来定。

节点标签： $y_v$
边标签： $y_{uv}$
图标签： $y_{G}$

它们都是向量的形式，一个样本有一个标签（同样也可以有 $N$ 个数据点）。

同样地，评价指标也可以根据具体的任务（分类/回归），按照传统的机器学习策略类比进行设计（可以理解成完全一样）。

数据集划分

不同于传统数据集中，训练集、验证集与测试集的划分（由于基于样本独立的假设，因此可以很轻松地随机划分）。图类型数据往往具有相依结构与信息。因此，对于图数据的划分通常有两种方式：

Transductive setting：可以在所有拆分的数据集（训练、验证和测试集）中观察到输入的完整图。这种方式只是拆分（节点）对应标签。
Inductive setting：将不同数据集划分之间的边删除，以得到多个图。

两者的适用情况如下：

Transductive setting
- 数据集由一张图组成
- 在所有数据集拆分中都可以观察到整个图，因此只需拆分标签
- 仅适用于节点/边缘预测任务
Inductive setting
- 数据集由多个图组成
- 每个划分的集合只能观察数据集合内的图结构。任务本身需要推广到看不见的图
- 适用于节点/边/图任务

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。