自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 SORA的应用与涌现能力

SORA的应用,涌现能力,不足之处

2024-03-03 22:39:10 347

原创 SORA技术报告

OpenAI官方SORA技术报告

2024-02-25 22:36:01 589 1

原创 论文阅读 | Smartbrush: Text and shape guided object inpainting with diffusion model

现存方法的问题:之前的方法如DALLE-2和StableDiffusion,都只支持文本引导,不支持mask的形状引导,生成内容时会改变object周围的背景纹理。为此,本文提出了一种能同时利用文本和mask形状进行引导生成的方法。具体的,通过使用新的采样策略和训练方式,让模型在生成内容的同时预测物体的mask,能让object外的背景部分保存得更好;同时提出了一种多任务训练策略,联合训练inpaint和文生图任务,能利用更多的数据进行训练。最终结果,从视觉质量、mask控制能力和背景保存度都更好。

2024-01-01 18:04:50 1208 1

原创 论文阅读 | Uni-paint:A Unified Framework for Multimodal Image Inpainting with Pretrained Diffusion Model

提出了一个统一的多种模态引导生成框架,对文本和参考图模态,将其转成Text Embedding;对简笔画模态,在去噪过程中与原图融合。另外两个策略,Mask finetuing使用少部分数据让模型具备在mask区域生成合理内容的能力,Masked attention让模型在mask区域生成的内容不会超过mask之外的区域。

2023-12-17 16:47:25 1341 1

原创 论文阅读 | RePaint: Inpainting using Denoising Diffusion Probabilistic Models

RePaint:使用训练好的扩散模型,在去噪过程中加入mask和resample策略,适配inpainting任务。

2023-12-10 21:25:22 2336

原创 CV算法工程师面试 高频基础知识点

算法工程师面试 必备高频基础知识点

2023-12-03 18:35:54 1589 1

原创 Inpainting方向2023顶会论文汇总

Inpainting方向2023顶会论文汇总

2023-11-26 17:53:32 1739 1

原创 文本文件的常用处理命令

7. 从文本文件的每一行截取关键字后面的几位 (取loss值,绘制loss曲线)1. 获取某路径下所有文件的绝对路径,并以列表形式存储在文件中。6. 取文本文件所有行的第一列(只取文件名,去除标签id)4. 相对路径改为绝对路径(文件每一行开头加指定内容)5. 两个文本文件按对应的列标拼接,并以制表符为间隔。2. 多个文本文件拼接。3. 打乱文本文件顺序。

2023-11-19 23:46:21 70

原创 conda常用命令

Conda常用命令大全

2023-11-12 17:06:17 187

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除