Submit Search
明日使えないすごいビット演算
95 likes
65,581 views
京大 マイコンクラブ
KMCの例会講座で用いたスライドを一部編集したものです。 ビット演算を組み合わせたトリッキーな方法で様々な操作を高速に行う方法を紹介します。
Technology
Read more
1 of 60
Download now
Downloaded 247 times
1
2
3
4
5
6
7
8
9
10
11
12
Most read
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
Most read
53
54
55
56
57
58
59
60
Most read
More Related Content
PDF
最大流 (max flow)
HCPC: 北海道大学競技プログラミングサークル
PDF
プログラミングコンテストでの動的計画法
Takuya Akiba
PDF
プログラムを高速化する話
京大 マイコンクラブ
PDF
ウェーブレット木の世界
Preferred Networks
PDF
Binary indexed tree
HCPC: 北海道大学競技プログラミングサークル
PPTX
動的計画法を極める!
HCPC: 北海道大学競技プログラミングサークル
PDF
プログラミングコンテストでのデータ構造 2 ~動的木編~
Takuya Akiba
PDF
最小カットを使って「燃やす埋める問題」を解く
shindannin
最大流 (max flow)
HCPC: 北海道大学競技プログラミングサークル
プログラミングコンテストでの動的計画法
Takuya Akiba
プログラムを高速化する話
京大 マイコンクラブ
ウェーブレット木の世界
Preferred Networks
Binary indexed tree
HCPC: 北海道大学競技プログラミングサークル
動的計画法を極める!
HCPC: 北海道大学競技プログラミングサークル
プログラミングコンテストでのデータ構造 2 ~動的木編~
Takuya Akiba
最小カットを使って「燃やす埋める問題」を解く
shindannin
What's hot
(20)
PDF
プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~
Takuya Akiba
PDF
RSA暗号運用でやってはいけない n のこと #ssmjp
sonickun
PDF
中3女子でもわかる constexpr
Genya Murakami
PPTX
充足可能性問題のいろいろ
Hiroshi Yamashita
PDF
指数時間アルゴリズム入門
Yoichi Iwata
PDF
マルチコアを用いた画像処理
Norishige Fukushima
PDF
Union find(素集合データ構造)
AtCoder Inc.
PDF
何となく勉強した気分になれるパーサ入門
masayoshi takahashi
PDF
様々な全域木問題
tmaehara
PDF
Constexpr 中3女子テクニック
Genya Murakami
PDF
プログラミングコンテストでの乱択アルゴリズム
Takuya Akiba
PDF
高速な倍精度指数関数expの実装
MITSUNARI Shigeo
PDF
LLVM最適化のこつ
MITSUNARI Shigeo
PDF
CRC-32
7shi
PDF
双対性
Yoichi Iwata
PDF
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
kiki utagawa
PDF
constexpr関数はコンパイル時処理。これはいい。実行時が霞んで見える。cpuの嬌声が聞こえてきそうだ
Genya Murakami
PDF
直交領域探索
okuraofvegetable
PDF
Rolling Hashを殺す話
Nagisa Eto
PDF
条件分岐とcmovとmaxps
MITSUNARI Shigeo
プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~
Takuya Akiba
RSA暗号運用でやってはいけない n のこと #ssmjp
sonickun
中3女子でもわかる constexpr
Genya Murakami
充足可能性問題のいろいろ
Hiroshi Yamashita
指数時間アルゴリズム入門
Yoichi Iwata
マルチコアを用いた画像処理
Norishige Fukushima
Union find(素集合データ構造)
AtCoder Inc.
何となく勉強した気分になれるパーサ入門
masayoshi takahashi
様々な全域木問題
tmaehara
Constexpr 中3女子テクニック
Genya Murakami
プログラミングコンテストでの乱択アルゴリズム
Takuya Akiba
高速な倍精度指数関数expの実装
MITSUNARI Shigeo
LLVM最適化のこつ
MITSUNARI Shigeo
CRC-32
7shi
双対性
Yoichi Iwata
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
kiki utagawa
constexpr関数はコンパイル時処理。これはいい。実行時が霞んで見える。cpuの嬌声が聞こえてきそうだ
Genya Murakami
直交領域探索
okuraofvegetable
Rolling Hashを殺す話
Nagisa Eto
条件分岐とcmovとmaxps
MITSUNARI Shigeo
Ad
Viewers also liked
(15)
PDF
ドット絵でプログラミング!難解言語『Piet』勉強会
京大 マイコンクラブ
PDF
Vivado hls勉強会5(axi4 stream)
marsee101
PDF
Vivado hls勉強会1(基礎編)
marsee101
PDF
GPUが100倍速いという神話をぶち殺せたらいいな ver.2013
Ryo Sakamoto
PDF
AAをつくろう!
Takami Sato
PDF
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Takami Sato
PDF
Data Science Bowl 2017Winning Solutions Survey
Takami Sato
PDF
High performance python computing for data science
Takami Sato
PPT
30分で博士号がとれる画像処理講座
Sakiyama Kei
PDF
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
Takami Sato
PDF
Quoraコンペ参加記録
Takami Sato
PDF
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Takami Sato
PDF
Scikit learnで学ぶ機械学習入門
Takami Sato
PDF
IIBMP2016 深層生成モデルによる表現学習
Preferred Networks
PPTX
猫でも分かるVariational AutoEncoder
Sho Tatsuno
ドット絵でプログラミング!難解言語『Piet』勉強会
京大 マイコンクラブ
Vivado hls勉強会5(axi4 stream)
marsee101
Vivado hls勉強会1(基礎編)
marsee101
GPUが100倍速いという神話をぶち殺せたらいいな ver.2013
Ryo Sakamoto
AAをつくろう!
Takami Sato
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Takami Sato
Data Science Bowl 2017Winning Solutions Survey
Takami Sato
High performance python computing for data science
Takami Sato
30分で博士号がとれる画像処理講座
Sakiyama Kei
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
Takami Sato
Quoraコンペ参加記録
Takami Sato
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Takami Sato
Scikit learnで学ぶ機械学習入門
Takami Sato
IIBMP2016 深層生成モデルによる表現学習
Preferred Networks
猫でも分かるVariational AutoEncoder
Sho Tatsuno
Ad
Similar to 明日使えないすごいビット演算
(20)
PDF
Javaセキュアコーディングセミナー東京第2回講義
JPCERT Coordination Center
PDF
kagami_comput2015_2
swkagami
PDF
kagami_comput2016_02
swkagami
PDF
kagamicomput201802
swkagami
PDF
kagamicomput201702
swkagami
PPT
計算機理論入門03
Tomoyuki Tarumi
PPTX
SIMDで整数除算
shobomaru
PDF
Deflate
7shi
PDF
フラグを愛でる
MITSUNARI Shigeo
PDF
コンピューターの1+1
np_sugimoto
PDF
kagami_comput2015_3
swkagami
PDF
kagami_comput2016_03
swkagami
PDF
Haswellサーベイと有限体クラスの紹介
MITSUNARI Shigeo
PDF
Pyramid
tomerun
PPTX
Schönhage Strassen Algorithm
cookies 146
PDF
実行時のデータ型の表現手法
Atusi Maeda
PDF
kagamicomput201703
swkagami
PPTX
PHP でバイナリ変換プログラミング
Yo Ya
PPTX
T77 episteme
えぴ 福田
PDF
教育ガラパゴスは必要ですか?
Tsutomu Kawamura
Javaセキュアコーディングセミナー東京第2回講義
JPCERT Coordination Center
kagami_comput2015_2
swkagami
kagami_comput2016_02
swkagami
kagamicomput201802
swkagami
kagamicomput201702
swkagami
計算機理論入門03
Tomoyuki Tarumi
SIMDで整数除算
shobomaru
Deflate
7shi
フラグを愛でる
MITSUNARI Shigeo
コンピューターの1+1
np_sugimoto
kagami_comput2015_3
swkagami
kagami_comput2016_03
swkagami
Haswellサーベイと有限体クラスの紹介
MITSUNARI Shigeo
Pyramid
tomerun
Schönhage Strassen Algorithm
cookies 146
実行時のデータ型の表現手法
Atusi Maeda
kagamicomput201703
swkagami
PHP でバイナリ変換プログラミング
Yo Ya
T77 episteme
えぴ 福田
教育ガラパゴスは必要ですか?
Tsutomu Kawamura
More from 京大 マイコンクラブ
(20)
PDF
テキストファイルを読む💪 第1回
京大 マイコンクラブ
PDF
かわいくなろうとしたら語彙力が下がった話
京大 マイコンクラブ
PDF
Common Lisp入門
京大 マイコンクラブ
PDF
多倍長整数の乗算と高速フーリエ変換
京大 マイコンクラブ
PDF
つくってあそぼ ラムダ計算インタプリタ
京大 マイコンクラブ
PDF
Geometry with Unity
京大 マイコンクラブ
PDF
セミコロンレスc++
京大 マイコンクラブ
PDF
エンジニアと健康
京大 マイコンクラブ
PPTX
女の子になれなかった人のために
京大 マイコンクラブ
PDF
Pietで競プロしよう
京大 マイコンクラブ
ODP
もし太陽のコアがIntelCoreだったら
京大 マイコンクラブ
PDF
C# ゲームプログラミングはホントにメモリのことに無頓着でいいの?
京大 マイコンクラブ
PDF
プログラムを高速化する話Ⅱ 〜GPGPU編〜
京大 マイコンクラブ
PDF
No SSH (@nojima; KMC関東例会)
京大 マイコンクラブ
PDF
DTM練習会2017第1.5回 「伴奏の付け方」
京大 マイコンクラブ
PPTX
hideya流 テストプレイ観察術
京大 マイコンクラブ
PDF
暗号技術入門 秘密の国のアリス 総集編
京大 マイコンクラブ
PDF
Altseed
京大 マイコンクラブ
PDF
C#でゲームを作る2016 第8回
京大 マイコンクラブ
PDF
C#でゲームを作る2016 第7回
京大 マイコンクラブ
テキストファイルを読む💪 第1回
京大 マイコンクラブ
かわいくなろうとしたら語彙力が下がった話
京大 マイコンクラブ
Common Lisp入門
京大 マイコンクラブ
多倍長整数の乗算と高速フーリエ変換
京大 マイコンクラブ
つくってあそぼ ラムダ計算インタプリタ
京大 マイコンクラブ
Geometry with Unity
京大 マイコンクラブ
セミコロンレスc++
京大 マイコンクラブ
エンジニアと健康
京大 マイコンクラブ
女の子になれなかった人のために
京大 マイコンクラブ
Pietで競プロしよう
京大 マイコンクラブ
もし太陽のコアがIntelCoreだったら
京大 マイコンクラブ
C# ゲームプログラミングはホントにメモリのことに無頓着でいいの?
京大 マイコンクラブ
プログラムを高速化する話Ⅱ 〜GPGPU編〜
京大 マイコンクラブ
No SSH (@nojima; KMC関東例会)
京大 マイコンクラブ
DTM練習会2017第1.5回 「伴奏の付け方」
京大 マイコンクラブ
hideya流 テストプレイ観察術
京大 マイコンクラブ
暗号技術入門 秘密の国のアリス 総集編
京大 マイコンクラブ
Altseed
京大 マイコンクラブ
C#でゲームを作る2016 第8回
京大 マイコンクラブ
C#でゲームを作る2016 第7回
京大 マイコンクラブ
明日使えないすごいビット演算
1.
明日使えないすごいビット演算 KMC1回生 prime(Twitter id:@_primenumber)
2.
ビット演算とは ● ● ● コンピューター内で数値や文字列などのデータは2進数で記 録されている ビット演算とは、2進数を0/1の列として操作するような演算 のこと ビット反転 (C言語では ~x) – 各ビットの0/1を反転させる x 0
1 1 0 1 0 1 1 ~x 1 0 0 1 0 1 0 0
3.
ビット演算とは ● ビット論理和 (C言語では x|y) – 各桁を比較して、少なくとも一方が1なら1 x y 0
0 1 0 1 0 1 1 x|y 1 1 1 0 1 0 1 1 1 1 0 0 1 0 0 1
4.
ビット演算とは ● ビット論理積 (C言語では x&y) – 各桁を比較して、両方とも1なら1 x y 0
0 1 0 1 0 1 1 x&y 0 0 0 0 1 0 0 1 1 1 0 0 1 0 0 1
5.
ビット演算とは ● ビット排他的論理和 (C言語では x^y) – 各桁を比較して、片方のみが1なら1 x y 0
0 1 0 1 0 1 1 x^y 1 1 1 0 0 0 1 0 1 1 0 0 1 0 0 1
6.
ビット演算とは ● 左ビットシフト (C言語では x<<n) – x 各桁を左に指定した桁数ずらす 0
0 1 0 1 0 1 1 x<<3 0 1 0 1 1 0 0 0
7.
ビット演算とは ● 右ビットシフト (C言語では x>>n) – x 各桁を右に指定した桁数ずらす 0
0 1 0 1 0 1 1 x>>3 0 0 0 1 0 1 0 1 上位桁に何を詰めるかによっていくつか種類がある ● 0を詰める ● 元の最上位桁と同じ物を詰める
8.
ビット演算とは ● ビット演算は回路が単純になるため、とても高速なことが多い – – ● とはいえ最近のCPUだと加減乗算も同じぐらい速い 組み合わせて使うことも多い うまく使うとものすごい高速化できる – ● ● 単純な実装に比べて数十倍速くなることも 今回はビット演算を用いていろいろな操作を高速にする例を 挙げます 数値は2の補数表現で格納されているものとします
9.
明日使えないすごいビット演算 ● 「1になっている一番下の桁」を取得する – 2の何乗で割り切れるか,みたいなことが分かったりする data 0 1 0 1 1 0 0 0
10.
明日使えないすごいビット演算 ● 「1になっている一番下の桁」を取得する – 2の何乗で割り切れるか,みたいなことが分かったりする data 0 1 0 1 1 0 0 0 0 0 0 0 1 0 0 0
11.
明日使えないすごいビット演算 ● 「1になっている一番下の桁」を取得する data & (-data) data 0 1 0 1 1 0 0 0 -data 1 0 1 0 1 0 0 0 実は,-dataは~data+1に等しい (足して0になるようにするため)
12.
明日使えないすごいビット演算 ● 「1になっている一番下の桁」を取得する data & (-data) data 0 1 0 1 1 0 0 0 -data 1 0 1 0 1 0 0 0 data
& (-data) 0 0 0 0 1 0 0 0 実は,-dataは~data+1に等しい (足して0になるため)
13.
明日使えないすごいビット演算 ● 「1になっている一番下の桁」を0にする data &= data-1 data 0 1 0 1 1 0 0 0 data-1 0 1 0 1 0 1 1 1 data
& data-1 0 1 0 1 0 0 0 0
14.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める – – ● 数値のだいたいの大きさを求める log2 ( n
) の整数部分を求めるのに使える これは一発では行かないが、うまい方法がある
15.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める – – ● 数値のだいたいの大きさを求める log 2 (
n ) の整数部分を求めるのに使える これは一発では行かないが、うまい方法がある – 二分探索!
16.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める 0 1 0 1 1 0 0 1 0xF0 1 1 1 1 0 0 0 0 ビット論理積 0 1 0 1 0 0 0 0
17.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める 0 1 0 1 1 0 0 1 0xF0 1 1 1 1 0 0 0 0 ビット論理積 0 1 0 1 0 0 0 0 != 0
18.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める 0 1 0 1 1 0 0 1 0xF0 1 1 1 1 0 0 0 0 ビット論理積 0 1 0 1 0 0 0 0 != 0 1になっている一番上の桁は上位4桁のどれか!
19.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める 0 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 0xCC 1 1 0 0 1 1 0 0 ビット論理積 0 1 0 0 0 0 0 0
20.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める 0 1 0 1 1 0 0 1 0 1 0 1 0 0 0 0 0xCC 1 1 0 0 1 1 0 0 ビット論理積 0 1 0 0 0 0 0 0 != 0 1になっている一番上の桁は上位2桁のどれか!
21.
明日使えないすごいビット演算 ● 「1になっている一番上の桁」を求める – data data data data data サンプルコード(32ビット) = = = = = data data data data data & & & & & 0xFFFF0000 0xFF00FF00 0xF0F0F0F0 0xCCCCCCCC 0xAAAAAAAA ? ? ? ? ? data data data data data & & & & & 0xFFFF0000 0xFF00FF00 0xF0F0F0F0 0xCCCCCCCC 0xAAAAAAAA : : : : : data; data; data; data; data;
22.
明日使えないすごいビット演算 ● ビット列を逆転する – 高速フーリエ変換などで用いる data 0 1 0 1 1 0 0 1 dataの逆転 1 0 0 1 1 0 1 0
23.
明日使えないすごいビット演算 ● ビット列を逆転する – これも一気にやるのは無理 data 0 0 1 data&0x55 data&0xAA 1 0 1 1 1 0 0 0 0 1 1 1 0
24.
明日使えないすごいビット演算 ● ビット列を逆転する data 0 1 0
1 1 0 0 1 (data&0x55)<<1 1 (data&0xAA)>>1 1 0 0 0 1 1 0
25.
明日使えないすごいビット演算 ● ビット列を逆転する data 0 1 0
1 1 0 0 1 (data&0x55)<<1 1 (data&0xAA)>>1 1 0 0 0 1 1 0 ビット論理和 1 0 1 0 0 1 1 0
26.
明日使えないすごいビット演算 ● ビット列を逆転する 変更前のdata 0 1 0
1 1 0 0 1 変更後のdata 1 0 1 0 0 1 1 0
27.
明日使えないすごいビット演算 ● ビット列を逆転する 0 1 0
1 1 0 0 1 変更後のdata 1 0 1 0 0 1 1 0 data&0x33 data&0xCC 1 0 1 0 1 0 0 1
28.
明日使えないすごいビット演算 ● ビット列を逆転する 0 1 0
1 1 0 0 1 変更後のdata 1 0 1 0 0 1 1 0 (data&0x33)<<2 1 0 (data&0xCC)>>2 1 0 1 0 0 1 1 0 1 0 1 0 0 1
29.
明日使えないすごいビット演算 ● ビット列を逆転する 0 1 0
1 1 0 0 1 1 0 1 0 0 1 1 0 1 0 1 0 1 0 0 1
30.
明日使えないすごいビット演算 ● ビット列を逆転する 0 1 0
1 1 0 0 1 1 0 1 0 0 1 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 0 1 0
31.
明日使えないすごいビット演算 ● ビット列を逆転する 0 1 0
1 1 0 0 1 1 0 0 1 1 0 1 0
32.
明日使えないすごいビット演算 ● ビット列を逆転する ● dataは32ビット符号なし型とする data = | data = | data
= | data = | data = ((data & ((data & ((data & ((data & ((data & ((data & ((data & ((data & (data << 0x55555555) 0xAA555555) 0x33333333) 0xCCCCCCCC) 0x0F0F0F0F) 0xF0F0F0F0) 0x00FF00FF) 0xFF00FF00) 16) | (data << >> << >> << >> << >> >> 1) 1); 2) 2); 4) 4); 8) 8); 16);
33.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● ビットレベルでハミング距離を取りたい時などに使う ● 素直な実装(int型を32bitと仮定) int count =
0; for (int i = 0;i < 32;i++) { count += (data >> i) & 1; }
34.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● ちょっと速い実装 int count =
0; for(; data; data &= data – 1) { ++count; } data &= data-1で1になっている一番小さい桁が0になる
35.
明日使えないすごいビット演算 ● ● 1になっているビットの数を数える けっこう速い実装 10進数 2進数 1の個数 0 00000000 0 1 00000001 1 2 00000010
1 3 00000011 2 4 00000100 1 ... ... ... 255 11111111 8 あらかじめ0~255までの数について1の個数を数えて配列に 入れておく
36.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● けっこう速い実装 int count =
0; count += table[data & 0xFF]; count += table[(data >> 8) & 0xFF]; count += table[(data >> 16) & 0xFF]; count += table[(data >> 24) & 0xFF]; table[256] : 1の個数が入った配列
37.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● 配列を使った実装はけっこう速い – 素直な方法の20倍くらい
38.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● 配列を使った実装はけっこう速い – ● 素直な方法の20倍くらい しかし、さらに倍くらい速い実装が存在する
39.
明日使えないすごいビット演算 1 0 1 1 0 1 0 0 各桁の0/1を「その桁の1の個数」と読み替えることができる
40.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 各桁の0/1を「その桁の1の個数」と読み替えることができる
41.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0x55 0 1 0 1 0 1 0 1 ビット論理積 0個 1個 1個 0個
42.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0xAA 1 0 1 0 1 0 1 ビット論理積 1個 1個 0個 0個 0
43.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 &0xAA 1個 &0x55 1個 0個 0個 1個 0個 1個 0個
44.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 1個 1個 0個 0個 0個 1個 1個 0個
45.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 1個 1個 0個 0個 0個 1個 1個 0個 足し算 0 1個 1 0個 0 1個 0 0個 2桁ごとに「その2桁にあった1の数」が格納された!!!
46.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 1個 &0xCC 0 1個 0個 1 &0x33 1 0 0個 1個 0 0個 0 0 1個 0個
47.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 1個 1 0個 1 0 0 1個 0 0個 0個 0 0個 1個 0 1個
48.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 1個 1 0個 1 0 0 1個 0 0個 0個 0 0個 1個 0 1個 0 1個 足し算 0 0 1 1個 0 0
49.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 0 1 1個 &0xF0 0 0 1 1個 0 0 1個 0 &0x0F 0 0 0 1個
50.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 0 1 1個 0 0 0 1個 0 0 0 1個 0 0 1 1個
51.
明日使えないすごいビット演算 1個 0個 1個
1個 0個 1個 0個 0個 0 0 1 1個 0 0 0 1個 0 0 0 1個 0 0 1 1個 0 0個 足し算 0 0 0 0 0 1
52.
明日使えないすごいビット演算 ● 1になっているビットの数を数える ● かなり速い実装(dataはunsigned int型) data = + data
= + data = + data = + data = + (data & 0x55555555) ((data & 0xAAAAAAAA) (data & 0x33333333) ((data & 0xCCCCCCCC) (data & 0x0F0F0F0F) ((data & 0xF0F0F0F0) (data & 0x00FF00FF) ((data & 0xFF00FF00) (data & 0x0000FFFF) ((data & 0xFFFF0000) >> 1); >> 2); >> 4); >> 8); >> 16);
53.
明日使えないすごいビット演算 ● こうして、苦労の末我々は爆速で1になっているビットの数を数 えるアルゴリズムを手に入れた!!!
54.
明日使えないすごいビット演算 ● ● こうして、苦労の末我々は爆速で1になっているビットの数を数 えるアルゴリズムを手に入れた!!! しかし・・・
55.
明日使えないすごいビット演算 ● ● ● こうして、苦労の末我々は爆速で1になっているビットの数を数 えるアルゴリズムを手に入れた!!! しかし・・・ IntelのSIMD拡張命令セット、SSE4.2から、ズバリ「1になって いるビットの数を数える」CPU命令が追加された!(popcnt)
56.
明日使えないすごいビット演算 ● ● ● こうして、苦労の末我々は爆速で1になっているビットの数を数 えるアルゴリズムを手に入れた!!! しかし・・・ IntelのSIMD拡張命令セット、SSE4.2から、ズバリ「1になって いるビットの数を数える」CPU命令が追加された!(popcnt) – 実際ビット演算を使ったアルゴリズムより2倍ほど速い
57.
明日使えないすごいビット演算 ● ● ● こうして、苦労の末我々は爆速で1になっているビットの数を数 えるアルゴリズムを手に入れた!!! しかし・・・ IntelのSIMD拡張命令セット、SSE4.2から、ズバリ「1になって いるビットの数を数える」CPU命令が追加された!(popcnt) – ● 実際ビット演算を使ったアルゴリズムより2倍ほど速い 我々の努力は無駄だった!!!!!
58.
まとめと注意 ● ● ビット演算はうまく使うととても高速 ぱっと見何してるか判りづらいのでバグを埋め込 みやすい – ものすごい高速化をする必要のないときは使わ ないほうが吉
59.
まとめと注意 ● ● ビット演算はうまく使うととても高速 ぱっと見何してるか判りづらいのでバグを埋め込 みやすい ものすごい高速化をする必要のないときは使わ ないほうが吉 CPU命令速い!!!!! – ● – 本当に高速化したいときはまずこっちを考えるべき
60.
おわり
Download