机器学习--自注意力机制3 进阶

ちゆきー

已于 2024-03-04 19:19:41 修改

阅读量1.3k

点赞数 30

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-03-02 17:56:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/projectfailed/article/details/136418579

一、进阶！多头注意力

自注意力有一个进阶的版本——多头自注意力（multi-head self-attention）。多头自注意力的使用是非常广泛的，在翻译、语音识别，用比较多的头可以得到比较好的结果。至于需要用多少的头，这个又是另外一个超参数（需要我们自己设置与调节）
在使用自注意力计算相关性的时候，就是用 q 去找相关的 k。相关有很多种不同的形式，所以可以有多个 q，不同的 q 负责不同种类的相关性，这就是多头注意力。
在这里插入图片描述

如图所示，先把 a 乘上一个矩阵得到 q，接下来再把 q 乘上另外两个矩阵，分别得到q1、q2。用两个上标，qi,1 跟 qi,2 代表有两个头，i 代表的是位置，1 跟 2 代表是这个位置的第几个 q，这个问题里面有两种不同的相关性，所以需要产生两种不同的头来找两种不同的相关性。
既然 q 有两个，k ，v 也就要有两个。怎么从 q 得到 q1、q2，其实就是把 q、k、v 分别乘上两个矩阵，得到不同的头。对另外一个位置也做一样的事情，另外一个位置在输入 a j以后，它也会得到两个 q、两个 k、两个 v。
做自注意力的方法跟之前讲的操作是一模一样的，只是现在 1 那一类的一起做，2 那一类的一起做。就是 q1 在算这个注意力的分数的时候，它就只管 k1 就好。qi,1 分别与 ki,1、kj,1

最低0.47元/天解锁文章

博客等级

码龄3年

38
原创

592
点赞

477
收藏

300
粉丝

关注

私信

热门文章

分类专栏

机器学习 22篇

展开全部收起

上一篇：: 机器学习--自注意机制2 运作原理

下一篇：: 机器学习--自注意力机制4 比较

最新评论

Android Studio修改Standard到Custom模式的方法
VFoutsider: 我遇到一个卡了好久没解决的问题，无法安装sdk（三个必要的sdk），试了很多办法（包括配置代理镜像）都不行，试了你的办法，重新更换到custom模式后，弄好了。但是我重新卸载，试图再按照当时的“错误”的步骤来时，却又没出问题了。又是一次稀里糊涂解决了问题，经验值＋0，时间-999.
吴恩达机器学习笔记：监督学习
ちゆきー: 答案：问题一是一个回归问题，如果我有数千件货物，我会把它看成一个实数，一个连续的值。因此卖出的物品数，也是一个连续的值。问题二是一个分类问题，因为我会把预测的值，用 0 来表示账户未被盗，用 1 表示账户曾经被盗过。所以我们根据账号是否被盗过，把它们定为 0 或 1，然后用算法推测一个账号是 0 还是 1，因为只有少数的离散值，所以我把它归为分类问题。
Android Studio修改Standard到Custom模式的方法
ちゆきー: 解决了就好
Android Studio修改Standard到Custom模式的方法
Bmarx666: 爱你找了半天终于搞定了么么
机器学习--循环神经网络（RNN）3
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/618352039。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。