
多模态
文章平均质量分 72
Macropodus
最后一次为理想而战
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python3使用openai调用Doubao-Seed-1.6的非思考/自动/思考模式(thinking)的代码
本文介绍了如何使用Python3通过OpenAI API调用Doubao-Seed-1.6模型,并控制其思考模式(thinking参数)。摘要要点: 通过设置extra_body参数中的"thinking"类型为"disabled"、"enabled"或"auto"来控制模型的思考模式 提供三种调用示例: 纯文本问答 处理远程图片 处理本地图片(需要Pillow库) 需要openai>=1.50.2和Pillow两个依赖包原创 2025-06-17 17:02:39 · 1112 阅读 · 0 评论 -
文档理解-layoutxlm-layoutlmv3
# 文档理解-layoutxlm-layoutlmv3-实验## 一、总结-summary - layoutxlm/layoutlmv3模型比较敏感, 不怎么稳定, 尤其是对lr很敏感, 2e-5至5e-5;原创 2022-10-26 08:56:38 · 2634 阅读 · 0 评论 -
多模态概述
多模态学习可以聚合多源数据的信息,使得模型学习到的表示更加完备。潜表示空间的质量决定了多模态模型的效果,数据量达到一定规模,模态种类越完整,多模态模型的效果越好。原创 2022-08-03 10:14:39 · 5659 阅读 · 0 评论 -
mmdetection使用记录汇总
最近需要用到多模态尤其是CV方面的知识, 所以学习和使用了一下mmdetection和其他CV项目, 总结记录下遇到的各种问题, 以便往后查阅。mmdetection版本为当前最新的2.24.1, 总的安装见mmdetection/requirements.txt, 实际上包括requirements/build.txt/optional.txt/runtime.txt/tests.txt四个文件的包,建议手动安装, 尤其是涉及的torch、mmcv-full、opencv-python、detectro原创 2022-07-05 14:32:51 · 970 阅读 · 0 评论