【多模态】《High-Order Attention Models for Visual Question Answering》论文阅读笔记

最新推荐文章于 2023-07-06 21:57:51 发布

CC‘s World

最新推荐文章于 2023-07-06 21:57:51 发布

阅读量543

点赞数

CC 4.0 BY-SA版权

分类专栏：多模态文章标签：深度学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36643449/article/details/124954443

该文章探讨了一种结合基于attention的多模态融合和基于双线性池化的融合方法在视觉问答（VQA）任务中的应用。模型结构简单而高效，整合了多种注意力机制和双线性池化技术，为多模态特征融合提供新思路。通过参考一系列相关论文，读者可以深入了解这两种融合策略如何增强VQA模型的表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章做的是VQA。同时，这篇文章集成了基于attention的多模态融合方法和基于双线性池化的多模态融合方法，为做VQA等多模态任务提供了很好的思路。

模型比较简单，但高效。

简单之处在于模型的组件都在之前的博客中学习过，没有新的结构之类的。高效之处在于集成了基于attention的多模态融合方法和基于双线性池化的多模态融合方法。

基于attention的多模态融合方法可以参考以下几篇博客：
【多模态】《Stacked Attention Networks for Image Question Answering》论文阅读笔记
 【多模态】《Where To Look: Focus Regions for Visual Question
Answering》论文阅读笔记
 【多模态】《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》论文阅读笔记
 【多模态】《Visual7W: Grounded Question Answering in
Image

最低0.47元/天解锁文章

博客等级

码龄9年

280
原创

135
点赞

870
收藏

116
粉丝

关注

私信

热门文章

分类专栏

Python 2篇
机器学习 27篇
广告系统 2篇
推荐系统学习 2篇
多模态 25篇
Keras 18篇
算法 11篇
计算机基础 9篇
工程应用 7篇
推荐算法 40篇
PySpark 9篇
C++ 14篇
论文阅读 4篇
TensorFlow 12篇
力扣 54篇
自然语言处理 5篇
MXNet 1篇
Pytorch 13篇
数据结构 2篇
剑指offer编程题 67篇
计算机视觉 1篇

展开全部收起

上一篇：: 【多模态】《Dual Attention Networks for Multimodal Reasoning and Matching》论文阅读笔记

下一篇：: 【多模态】《GATED MULTIMODAL UNITS FOR INFORMATION FUSION》论文阅读笔记

最新评论

【算法】局部敏感哈希 LSH 的 Python 实现
不断生长: 想问一下，这个局部敏感哈希和位置敏感哈希(location sensitive hash)是一样的吗？
【算法】局部敏感哈希 LSH 的 Python 实现
柚子树cc: 后面两个minhash的验证应该使用Jaccard距离吧，找出来的topk明显不太对
【算法】局部敏感哈希 LSH 的 Python 实现
m0_56951613: 最近在学lsh，看了这篇文章有两个问题想问问博主 1、e2lsh不是需要L个哈希函数族，每族k个哈希函数吗，感觉你的代码里好像只有一个哈希函数族，不知道是不是我理解错了 2、经过lsh筛选后，只比较前20个数据的话确实看起来精确度很高，但我输出了candidates发现其实筛选后还有8，9000个数据，也就是说只排除了1000多个数据，我试过其他人的代码，但基本都有这个问题，要保证精确度的话筛选掉的数据量就会很小，想要筛选完的数据量小的话精确度就会很低，是这算法原本的目的就是在海量数据集里筛选掉一小部分的数据吗，还是调参没调好导致效果太差？
【计算机基础】github使用 & git命令
朗197: 帮助很大，非常感谢！！！
【论文阅读】Adaptive Mixtures of Local Experts
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。