CPU・GPU
    ハイブリッドコンピューティング
     薦田 登志矢システム情報学専攻 博士3年
        komoda@hal.ipc.i.u-tokyo.ac.jp



1             2012 12/3 リサーチャーズカフェ       2012/12/5
並列計算機としてのGPU
   GPU is Everywhere
       Top 500 super computers
           52/500 のスパコンにGPUが搭載 (ICS, 2012)
       ラップトップ・モバイル端末
           GPUが搭載されているのが普通
                                                      AMD Radeon


   汎用的な並列処理をGPU上で実行
    (GPUコンピューティング)
       科学技術計算
       データマイニング
       動画像処理
                                                        NVIDIA Tesla
    2                      2012 12/3 リサーチャーズカフェ   2012/12/5
ヘテロジニアスシステム上の
タスクスケジューリング
   実用的なGPGPUアプリケーション
       「CPU処理」・「GPU処理」・「データ転送
        処理」が
        混在
GPU上でデータ並列性だけを利用するだ
    けでは不十分.

   粒度の大きなタスク並列性の利用
           CPU・GPU・データ転送バスという異なるデバ
            イス上
3
            で異なるタスクを並列実行したい 2012/12/5
                     2012 12/3 リサーチャーズカフェ
GPGPUアプリケーションのための
  タスクスケジューリングライブラリ
 パイプライン処理によるタスク並列性の利用
      高性能と高生産性の両立
                        input



 Applications    k1             k2   スケジューリング            CPU


                                k3
                                                         BUS
(APIを用いてライブラリの
タスクグラフ解析を支援)           output

 Programmers     タスクの依存関係を
                 表現したグラフ                                 GPU
   4                  2012 12/3 リサーチャーズカフェ   2012/12/5
実験結果(縦軸:性能向上率)
1.5
                                                  • 評価環境
 1
                                normal              • Intel CPU +
                                proposal
0.5
                                ideal overlap
                                                      Nvidia GPU
 0                                                  • OpenCLを用
      fft   nw   median   box                         いて提案ライブ
データ転送とGPU処理の並列実行(without User Hint)
                                                    • ラリを実装


                                                  • アプリケー
                                                   ション
                                                   • HPCアプリ
                                                   • 画像処理
 CPU, GPU, データ転送処理の並列実行 (with User Hint)
  5                        2012 12/3 リサーチャーズカフェ   2012/12/5
今後の課題
       大規模なアプリケーションへの提案ライブラリ
        の適用
       複数アクセラレータの並列実行
       低消費電力技術との融合
           動的電圧周波数制御とタスクスケジューリングの強調




                      GPUアプリケーションの
                      消費電力測定系

    6               2012 12/3 リサーチャーズカフェ   2012/12/5

More Related Content

PDF
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
PDF
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
PDF
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
PDF
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
PDF
Introduction to argo
PDF
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也
PDF
CUDAプログラミング入門
PPTX
Cho Bachelor Thesis
モバイル(エッジ)向け ニューラルネットワーク推論エンジンの紹介
2015年度先端GPGPUシミュレーション工学特論 第14回 複数GPUの利用
2015年度先端GPGPUシミュレーション工学特論 第15回 CPUとGPUの協調
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
Introduction to argo
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也
CUDAプログラミング入門
Cho Bachelor Thesis

What's hot (20)

PDF
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
PDF
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
PPTX
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
PDF
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
PDF
GCPUG-FUKUOKA データ加工&可視化ハンズオン
PDF
Yu Sasaki Bachelor Thesis
PDF
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
PDF
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
PDF
Junnosuke Mizutani Bachelor Thesis
PDF
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
PDF
How to Schedule Machine Learning Workloads Nicely In Kubernetes #CNDT2020 / C...
PDF
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
PPTX
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
PDF
2015年度GPGPU実践基礎工学 第4回 CPUのアーキテクチャ
PDF
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
PDF
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
PDF
2015年度GPGPU実践基礎工学 第6回 ソフトウェアによるCPUの高速化技術
PDF
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
PDF
2015年度GPGPU実践プログラミング 第11回 画像処理
PDF
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
2015年度GPGPU実践基礎工学 第5回 ハードウェアによるCPUの高速化技術
GCPUG-FUKUOKA データ加工&可視化ハンズオン
Yu Sasaki Bachelor Thesis
2015年度GPGPU実践基礎工学 第14回 GPGPU組込開発環境
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
Junnosuke Mizutani Bachelor Thesis
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
How to Schedule Machine Learning Workloads Nicely In Kubernetes #CNDT2020 / C...
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
EC2に対するcloudwatchのアクション設定がポリシーで使えないときの代替策
2015年度GPGPU実践基礎工学 第4回 CPUのアーキテクチャ
2015年度GPGPU実践プログラミング 第6回 パフォーマンス解析ツール
2015年度先端GPGPUシミュレーション工学特論 第11回 数値流体力学への応用 (支配方程式,CPUプログラム)
2015年度GPGPU実践基礎工学 第6回 ソフトウェアによるCPUの高速化技術
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
2015年度GPGPU実践プログラミング 第11回 画像処理
2015年度GPGPU実践基礎工学 第12回 GPUによる画像処理
Ad

Viewers also liked (18)

PDF
GPU ソリューションラボならびに検証/導入事例のご紹介
PDF
1090: NVIDIA プロフェッショナルビジュアリゼーション
PPTX
CUDA & OpenCL GPUコンピューティングって何?
PDF
2014年12月13日 アカリクITイベント 川原尚人_スライド
PDF
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
PDF
グラフィックスの仮想化を実現する NVIDIA GRID™ ~仮想マシンからの GPU の利用方法と、今後の展開~
PDF
NVIDIA GRID が実現する GPU 仮想化テクノロジー
PDF
エヌビディア GPU が加速するディープラーニング
PPTX
HPCフォーラム2015 基調講演 HPテクニカルコンピューティング最前線 ~HP Apollo Systemディープダイブと、世界の採用事例~ Ed T...
PDF
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
PDF
45分で理解する 最近のスパコン事情 斉藤之雄
PDF
1000: 基調講演
PDF
FPGAによる津波シミュレーション -- GPUを超える高性能計算の手法
PDF
Gpu vs fpga
PDF
なぜGPUはディープラーニングに向いているか
PPTX
ディープラーニングにおける学習の高速化の重要性とその手法
PPTX
企業の人工知能 AI
PPTX
人工知能 AI 時代の幕開け~新たなコンピューティング モデル、GPU ディープラーニングが火付け役に~
GPU ソリューションラボならびに検証/導入事例のご紹介
1090: NVIDIA プロフェッショナルビジュアリゼーション
CUDA & OpenCL GPUコンピューティングって何?
2014年12月13日 アカリクITイベント 川原尚人_スライド
2015年度先端GPGPUシミュレーション工学特論 第2回 GPUによる並列計算の概念と メモリアクセス
グラフィックスの仮想化を実現する NVIDIA GRID™ ~仮想マシンからの GPU の利用方法と、今後の展開~
NVIDIA GRID が実現する GPU 仮想化テクノロジー
エヌビディア GPU が加速するディープラーニング
HPCフォーラム2015 基調講演 HPテクニカルコンピューティング最前線 ~HP Apollo Systemディープダイブと、世界の採用事例~ Ed T...
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
45分で理解する 最近のスパコン事情 斉藤之雄
1000: 基調講演
FPGAによる津波シミュレーション -- GPUを超える高性能計算の手法
Gpu vs fpga
なぜGPUはディープラーニングに向いているか
ディープラーニングにおける学習の高速化の重要性とその手法
企業の人工知能 AI
人工知能 AI 時代の幕開け~新たなコンピューティング モデル、GPU ディープラーニングが火付け役に~
Ad

Similar to 2012 1203-researchers-cafe (20)

PDF
【A-1】AIを支えるGPUコンピューティングの今
PDF
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
PPTX
GPU-FPGA協調プログラミングを実現するコンパイラの開発
PDF
1072: アプリケーション開発を加速するCUDAライブラリ
PDF
20170421 tensor flowusergroup
PDF
2012-03-08 MSS研究会
DOC
GPGPUによるパーソナルスーパーコンピュータの可能性
PDF
機械学習とこれを支える並列計算: ディープラーニング・スーパーコンピューターの応用について
PDF
【旧版】2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
PDF
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
PDF
200625material naruse
PDF
Hello, DirectCompute
PDF
GPGPU Education at Nagaoka University of Technology: A Trial Run
KEY
NVIDIA Japan Seminar 2012
KEY
GTC2011 Japan
PDF
インテルFPGAのDeep Learning Acceleration SuiteとマイクロソフトのBrainwaveをHW視点から比較してみる Intel編
PDF
GPUディープラーニング最新情報
KEY
PyOpenCLによるGPGPU入門
PDF
Halide, Darkroom - 並列化のためのソフトウェア・研究
【A-1】AIを支えるGPUコンピューティングの今
GPU-FPGA 協調計算を記述するためのプログラミング環境に関する研究(HPC169 No.10)
GPU-FPGA協調プログラミングを実現するコンパイラの開発
1072: アプリケーション開発を加速するCUDAライブラリ
20170421 tensor flowusergroup
2012-03-08 MSS研究会
GPGPUによるパーソナルスーパーコンピュータの可能性
機械学習とこれを支える並列計算: ディープラーニング・スーパーコンピューターの応用について
【旧版】2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
200625material naruse
Hello, DirectCompute
GPGPU Education at Nagaoka University of Technology: A Trial Run
NVIDIA Japan Seminar 2012
GTC2011 Japan
インテルFPGAのDeep Learning Acceleration SuiteとマイクロソフトのBrainwaveをHW視点から比較してみる Intel編
GPUディープラーニング最新情報
PyOpenCLによるGPGPU入門
Halide, Darkroom - 並列化のためのソフトウェア・研究

More from Toshiya Komoda (6)

PDF
5分で分かるselenium conference berlin 2017
PDF
Introduce Machine Learning into UI Tests
PDF
selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...
PDF
Isca13 study
PPTX
Micro12勉強会 20130303
PDF
20130126 sc12-reading
5分で分かるselenium conference berlin 2017
Introduce Machine Learning into UI Tests
selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...
Isca13 study
Micro12勉強会 20130303
20130126 sc12-reading

2012 1203-researchers-cafe

  • 1. CPU・GPU ハイブリッドコンピューティング 薦田 登志矢システム情報学専攻 博士3年 [email protected] 1 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 2. 並列計算機としてのGPU  GPU is Everywhere  Top 500 super computers  52/500 のスパコンにGPUが搭載 (ICS, 2012)  ラップトップ・モバイル端末  GPUが搭載されているのが普通 AMD Radeon  汎用的な並列処理をGPU上で実行 (GPUコンピューティング)  科学技術計算  データマイニング  動画像処理 NVIDIA Tesla 2 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 3. ヘテロジニアスシステム上の タスクスケジューリング  実用的なGPGPUアプリケーション  「CPU処理」・「GPU処理」・「データ転送 処理」が 混在 GPU上でデータ並列性だけを利用するだ けでは不十分.  粒度の大きなタスク並列性の利用  CPU・GPU・データ転送バスという異なるデバ イス上 3 で異なるタスクを並列実行したい 2012/12/5 2012 12/3 リサーチャーズカフェ
  • 4. GPGPUアプリケーションのための タスクスケジューリングライブラリ パイプライン処理によるタスク並列性の利用  高性能と高生産性の両立 input Applications k1 k2 スケジューリング CPU k3 BUS (APIを用いてライブラリの タスクグラフ解析を支援) output Programmers タスクの依存関係を 表現したグラフ GPU 4 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 5. 実験結果(縦軸:性能向上率) 1.5 • 評価環境 1 normal • Intel CPU + proposal 0.5 ideal overlap Nvidia GPU 0 • OpenCLを用 fft nw median box いて提案ライブ データ転送とGPU処理の並列実行(without User Hint) • ラリを実装 • アプリケー ション • HPCアプリ • 画像処理 CPU, GPU, データ転送処理の並列実行 (with User Hint) 5 2012 12/3 リサーチャーズカフェ 2012/12/5
  • 6. 今後の課題  大規模なアプリケーションへの提案ライブラリ の適用  複数アクセラレータの並列実行  低消費電力技術との融合  動的電圧周波数制御とタスクスケジューリングの強調 GPUアプリケーションの 消費電力測定系 6 2012 12/3 リサーチャーズカフェ 2012/12/5