Submit Search
2018 07 02_dense_pose
Download as PPTX, PDF
•
3 likes
•
6,570 views
H
harmonylab
Dense Pose: Dense Human Pose Estimation In tThe Wild
Technology
Read more
1 of 25
Download now
Downloaded 12 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
More Related Content
What's hot
(20)
PPTX
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII
PPTX
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
Deep Learning JP
PDF
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
Deep Learning JP
PDF
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
Hironobu Fujiyoshi
PDF
AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦
Tatsuya Matsushima
PPTX
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
PDF
優れた問いを見つける(中京大学講演)
cvpaper. challenge
PDF
【論文読み会】Self-Attention Generative Adversarial Networks
ARISE analytics
PPTX
[DL輪読会]A closer look at few shot classification
Deep Learning JP
PDF
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
PDF
ICCV 2019 論文紹介 (26 papers)
Hideki Okada
PPTX
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
PPTX
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
PDF
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
Deep Learning JP
PDF
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
PDF
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
Deep Learning JP
PDF
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
Deep Learning JP
PDF
点群深層学習 Meta-study
Naoya Chiba
PDF
【メタサーベイ】Neural Fields
cvpaper. challenge
PDF
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII
[DLHacks]StyleGANとBigGANのStyle mixing, morphing
Deep Learning JP
[DL輪読会]StarGAN: Unified Generative Adversarial Networks for Multi-Domain Ima...
Deep Learning JP
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
Hironobu Fujiyoshi
AIのラボからロボティクスへ --- 東大松尾研究室のWRS2020パートナーロボットチャレンジへの挑戦
Tatsuya Matsushima
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
優れた問いを見つける(中京大学講演)
cvpaper. challenge
【論文読み会】Self-Attention Generative Adversarial Networks
ARISE analytics
[DL輪読会]A closer look at few shot classification
Deep Learning JP
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
ICCV 2019 論文紹介 (26 papers)
Hideki Okada
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
[DL輪読会]AdaShare: Learning What To Share For Efficient Deep Multi-Task Learning
Deep Learning JP
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
Deep Learning JP
[DL輪読会]A Style-Based Generator Architecture for Generative Adversarial Networks
Deep Learning JP
点群深層学習 Meta-study
Naoya Chiba
【メタサーベイ】Neural Fields
cvpaper. challenge
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
Similar to 2018 07 02_dense_pose
(20)
PPTX
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
PDF
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
PDF
CVPR2011 Festival PDF
Masafumi Noda
PDF
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
PDF
[DLHacks 実装] DeepPose: Human Pose Estimation via Deep Neural Networks
Deep Learning JP
PPTX
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
Deep Learning JP
PDF
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
PDF
Deformable Part Modelとその発展
Takao Yamanaka
PPTX
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
PPTX
[DL輪読会]Human Pose Estimation @ ECCV2018
Deep Learning JP
PDF
DeepLearningDay2016Summer
Takayoshi Yamashita
PPTX
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
PPTX
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
PDF
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
Shunsuke Ono
PPTX
論文紹介: Fast R-CNN&Faster R-CNN
Takashi Abe
PDF
【2015.05】cvpaper.challenge@CVPR2015
cvpaper. challenge
PPTX
Crowd Counting & Detection論文紹介
Plot Hong
PPTX
[DL輪読会]Deep Face Recognition: A Survey
Deep Learning JP
PPTX
CVPR2018 参加報告(速報版)初日
Atsushi Hashimoto
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
cvpaper. challenge
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
CVPR2011 Festival PDF
Masafumi Noda
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
[DLHacks 実装] DeepPose: Human Pose Estimation via Deep Neural Networks
Deep Learning JP
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
Deep Learning JP
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
Deformable Part Modelとその発展
Takao Yamanaka
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
[DL輪読会]Human Pose Estimation @ ECCV2018
Deep Learning JP
DeepLearningDay2016Summer
Takayoshi Yamashita
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
夏のトップカンファレンス論文読み会 / Realtime Multi-Person 2D Pose Estimation using Part Affin...
Shunsuke Ono
論文紹介: Fast R-CNN&Faster R-CNN
Takashi Abe
【2015.05】cvpaper.challenge@CVPR2015
cvpaper. challenge
Crowd Counting & Detection論文紹介
Plot Hong
[DL輪読会]Deep Face Recognition: A Survey
Deep Learning JP
CVPR2018 参加報告(速報版)初日
Atsushi Hashimoto
【2015.07】(1/2)cvpaper.challenge@CVPR2015
cvpaper. challenge
Ad
More from harmonylab
(20)
PDF
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
harmonylab
PDF
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
PDF
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
harmonylab
PPTX
【修士論文】帝国議会および国会議事速記録における可能表現の長期的変遷に関する研究
harmonylab
PPTX
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
harmonylab
PDF
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
PDF
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
PPTX
【修士論文】LLMを用いた俳句推敲と批評文生成に関する研究
harmonylab
PDF
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
PPTX
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
PDF
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
harmonylab
PDF
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
PDF
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
PPTX
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
harmonylab
PPTX
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
PPTX
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
PPTX
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
PPTX
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
PPTX
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
PPTX
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
harmonylab
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
harmonylab
【修士論文】帝国議会および国会議事速記録における可能表現の長期的変遷に関する研究
harmonylab
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
harmonylab
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
【修士論文】LLMを用いた俳句推敲と批評文生成に関する研究
harmonylab
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
harmonylab
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
harmonylab
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
Ad
Recently uploaded
(9)
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
PDF
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
PDF
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
PDF
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
2018 07 02_dense_pose
1.
Dense Pose: Dense
Human Pose Estimation In The Wild 2018年7月2日(月) 細川 皓平
2.
概要 • タイトル • DensePose:
Dense Human Pose Estimation In The Wild • 著者 • Riza Alp Guler, Natalia Neverova, Iasonas Kokkinos • 所属 • Facebook AI Research • 発表 • CVPR 2018 (https://arxiv.org/abs/1802.00434) • ソースコードが6/18に公開 (https://github.com/facebookresearch/DensePose) • 目的 • リアルタイムでRGB画像中の全ての人物領域を3次元にマッピング • DensePose-RCNN System による,各部位ごとのUV座標の回帰 • 学習のためにCOCO Dataset に手動でアノテーションしたCOCO- DensePose データセットの作成 DensePose 2
3.
DensePose 3 オリジナル画像 体の面に対するパーティショニング と UV展開画像 DensePose-COCO (アノテーション) DensePose-RCNNの出力画像
4.
COCO-DensePose Dataset • COCO-Dataset
から人が写っている画像を収集 • 330K枚の画像中,50.3K人分の画像を使用 (何枚かは書いてなかった) • 各パーツに分割.全24. • 頭 (左,右) • 首 • 胴体 • 腕(左,右 / 上,前 / 前,後) • 脚 (左,右 / 太もも,ふくらはぎ / 前,後) • 手 (左,右) • 足 (左,右) DensePose 4
5.
COCO-DensePose Dataset • サンプルポイントをつける •
数はパーツのサイズによる • 最大で14 個 • 人体のモデルとしてSMPL [1] モデルを使用 DensePose 5 [1] Loper, Matthew, et al. "SMPL: A skinned multi-person linear model." ACM Transactions on Graphics (TOG) 34.6 (2015): 248. SMPL モデル
6.
COCO-DensePose Dataset DensePose 6 •
アノテーション用ソフトのキャプチャ • 点を打つと (赤のX),6方向からのCG中に対応する点が描画される
7.
COCO-DensePose Dataset DensePose 7 •
アノテーションの結果 • 左: オリジナル • 中央: Uの値 • 右: Vの値
8.
評価指標: 点ごとの評価 • AUC:
Area Under the Curve • AUCα は予測した点と正確な点の距離の閾値をα とした時の精度 • ここでは,α = 10cm, 30cm の2通りを採用している • GPS: geodesic point similarity • 𝐺𝑃𝑆𝑗 = 1 𝑃 𝑗 𝑝∈𝑃 𝑗 −𝑔 𝑖 𝑝, 𝑖 𝑝 2 2𝑘2 • 𝑃𝑗: アノテーションしたperson instance j の点の集合 (person instance: 24のパーツ ?) • 𝑖 𝑝 : 点p でモデルによって推定された頂点 • 𝑖 𝑝 : 正確な頂点 • 𝑘 = 0.255 : 正規化パラメータ • 完璧な予測をすると,0.5になる • Average Precision (AP) と Average Recall (AR) で評価する DensePose 8
9.
DensePose-RCNN • 基本は DenseReg
[2] (先行研究)と Mask-RCNN [3] の組合せ 1. Region Proposal Network (RPN) [4] で矩形領域抽出 2. ROI-Align Pooling [5] で固定サイズに変換 3. Cross-cascading architecture • Mask R-CNN • 体の部位と部位同士の繋り (keypoints) • 人物領域 (mask) • DensePose network • UV座標 DensePose 9 [2] Güler, Rıza Alp, et al. "Densereg: Fully convolutional dense shape regression in-the-wild." Proc. CVPR. Vol. 2. No. 3. 2017. [3] He, Kaiming, et al. "Mask r-cnn." Computer Vision (ICCV), 2017 IEEE International Conference on. IEEE, 2017. [4] Ren, Shaoqing, et al. "Faster r-cnn: Towards real-time object detection with region proposal networks." Advances in neural information processing systems. 2015.
10.
DensePose-RCNN: 矩形領域抽出 • ResNet-50
[6] + Feature pyramid networks (FPN) [7] • ResNet-50 • 特に理由は書いてない • まあ表現力が高い • FPN • 様々なスケールに対応するための ネットワーク • 中間層の出力マップと,最終層の 出力マップをアップサンプリングし たものを足し合せて,スケールごと に予測をする DensePose 10 FPN とその他の構造の比較 (a) 理想だが重い (b) 一般的なCNN (c) 浅い層の表現力が乏しい (d) 表現力も高く計算量も少ない [6] He, Kaiming, et al. "Deep residual learning for image recognition." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. [7] Lin, Tsung-Yi, et al. "Feature pyramid networks for object detection." CVPR. Vol. 1. No. 2. 2017.
11.
DensePose-RCNN: 矩形領域抽出 • Region
Proposal Network • 特徴マップから矩形の候補領域を求めるネットワーク 1. nxn のウィンドウをスライド 2. 各位置でk種類のアンカーを生成 3. それぞれのアンカーに対し, 1. objectか否かの2クラス分類 2. Bounding box の4点を求める回帰 を行なう. • N = 3 • K = 9 • Anchor: 9種類 • スケール: (0.5, 1.0, 2.0) • アスペクト比: (1:1, 1:2, 2:1) DensePose 11
12.
DensePose-RCNN: ROI Align
Pooling • Mask R-CNN,DencePose Networkへの入力を固定長にしたい.(下図だと 3x3) • Pytorch実装 (この論文でも使っている) では,binの中央のサブピクセルに対して Bilinear Interpolation してる • Tensorflow ではただのresize DensePose 12 (双方向補完) 参考) Qiita: 最新の物体検出手法Mask R-CNNのRoI Alignと Fast(er) R-CNNのRoI Poolingの違いを正しく理解する https://qiita.com/yu4u/items/5cbe9db166a5d72f9eb8
13.
DensePose-RCNN: Mask-RCNN • RoI
Align Pooling後の画像を入力 • keypointsとmasksを出力 • オリジナルのMask R-CNNと比較して, マップ数を2倍の512に変更している • (keypointsの推定に512必要なので, masksもそれに合わせている) DensePose 13 filter: 3x3 stride: 1 X 512 filter: 2x2 stride: 2 filter: 1x1 stride: 1 X 512 X 512 X 512 物体判別部分.ここでは人だけなので関係無い
14.
DensePose-RCNN: DensePose Network •
75 て何? • Patch てどこからきたんだ ? • ちょっとよくわからない DensePose 14
15.
DensePose-RCNN: Cross-cascading architecture •Mask
R-CNN部分での特徴量とDensePose Network部分での特徴量 を互いに足し合わせる •相乗効果で,より効果的な特徴量が得られる DensePose 15
16.
DensePose-RCNN: Teacher Network •Dense
pose 推定のためには人物領域全体に対して密にアノテーションする必 要があるのに対し,実際には100〜150程度しか行っていない •これらをもとに塗り潰しを行う,”teacher” ネットワークを学習により構築して, 密な教師信号を生成する.(詳細不明) DensePose 16
17.
実験: データセット •COCO-DensePose •テストデータ • 15000枚
(23000人分) •訓練データ • 480000人分 DensePose 17
18.
実験: データセットの比較 DensePose 18
19.
実験: 3D画像推定モデルとの比較 • 一人の画像 •
DensePose が最も精度が高い • 特に体全体が写っていない画像に対し ては差が大きい • 計算スピードに関しても,他の手法が 60-200 [sec / image] (?) に対し,0.04 – 0.25 とかなり速い DensePose 19
20.
実験: 各モジュールごとの評価 • DP-FCN •
DensePose Network の部分だけ • スケールに対するロバスト性が不十 分 • DP-RCNN (points only) • RPNを追加 • 急激にパフォーマンスが上昇 • DP-RCNN(distillations) • “teacher” networkを追加 • DP-RCNN(cascade) • Mask-RCNNを追加 • DP* • 背景の削除,複数のスケールのアン サンブル DensePose 20
21.
実験: ベースネットワークの違い • 単純に大きいネットワークの方が良い評価ではあるが,大した差では無い DensePose
21
22.
実験: Multi-task とcascading •
Mask とkeypointsでは,keypoints の方が全体の評価に大きく影響を与 えている • 指標によっては,keypoints のみを使用した方がいい場合もある DensePose 22
23.
定性的な評価 • スカートや服,周りの物体を無視できている DensePose 23
24.
定性的な評価 • スケールやポーズによらず評価できている DensePose 24
25.
Texture Transfer DensePose 25
Download