明日使えないすごいビット演算

明日使えないすごいビット演算
KMC1回生 prime(Twitter id:@_primenumber)

ビット演算とは
●

●

●

コンピューター内で数値や文字列などのデータは２進数で記
録されている
ビット演算とは、２進数を0/1の列として操作するような演算
のこと
ビット反転 (C言語では ~x)
–

各ビットの0/1を反転させる

x

0 1 1 0 1 0 1 1

~x

1 0 0 1 0 1 0 0

●

ビット論理和 (C言語では x|y)
–

各桁を比較して、少なくとも一方が1なら1

x
y

0 0 1 0 1 0 1 1

x|y

1 1 1 0 1 0 1 1

1 1 0 0 1 0 0 1

●

ビット論理積 (C言語では x&y)
–

各桁を比較して、両方とも1なら1

x
y

0 0 1 0 1 0 1 1

x&y

0 0 0 0 1 0 0 1

1 1 0 0 1 0 0 1

●

ビット排他的論理和 (C言語では x^y)
–

各桁を比較して、片方のみが1なら1

x
y

0 0 1 0 1 0 1 1

x^y

1 1 1 0 0 0 1 0

1 1 0 0 1 0 0 1

●

左ビットシフト (C言語では x<<n)
–

x

各桁を左に指定した桁数ずらす

0 0 1 0 1 0 1 1

x<<3 0 1 0 1 1 0 0 0

●

右ビットシフト (C言語では x>>n)
–

x

各桁を右に指定した桁数ずらす

0 0 1 0 1 0 1 1

x>>3 0 0 0 1 0 1 0 1
上位桁に何を詰めるかによっていくつか種類がある
● 0を詰める
● 元の最上位桁と同じ物を詰める

●

ビット演算は回路が単純になるため、とても高速なことが多い
–
–

●

とはいえ最近のCPUだと加減乗算も同じぐらい速い
組み合わせて使うことも多い

うまく使うとものすごい高速化できる
–

●

●

単純な実装に比べて数十倍速くなることも

今回はビット演算を用いていろいろな操作を高速にする例を
挙げます
数値は２の補数表現で格納されているものとします

●

「1になっている一番下の桁」を取得する
–

2の何乗で割り切れるか,みたいなことが分かったりする

data

0

1

0

1

1

0

0

0

●

–

2の何乗で割り切れるか,みたいなことが分かったりする

data

0

1

0

1

1

0

0

0

0

0

0

0

1

0

0

0

●


data & (-data)
data

0

1

0

1

1

0

0

0

-data

1

0

1

0

1

0

0

0

実は,-dataは~data+1に等しい
(足して0になるようにするため)

●


data & (-data)
data

0

1

0

1

1

0

0

0

-data

1

0

1

0

1

0

0

0

data & (-data) 0

0

0

0

1

0

0

0

実は,-dataは~data+1に等しい
(足して0になるため)

●

「1になっている一番下の桁」を0にする

data &= data-1
data

0

1

0

1

1

0

0

0

data-1

0

1

0

1

0

1

1

1

data & data-1

0

1

0

1

0

0

0

0

●

「1になっている一番上の桁」を求める
–
–

●

数値のだいたいの大きさを求める
log2 ( n ) の整数部分を求めるのに使える

これは一発では行かないが、うまい方法がある

●

–
–

●

数値のだいたいの大きさを求める
log 2 ( n ) の整数部分を求めるのに使える

これは一発では行かないが、うまい方法がある
–

二分探索！

●


0

1

0

1

1

0

0

1

0xF0 1

1

1

1

0

0

0

0

ビット論理積

0

1

0

1

0

0

0

0

●


0

1

0

1

1

0

0

1

0xF0 1

1

1

1

0

0

0

0

ビット論理積

0

1

0

1

0

0

0

0

!= 0

●


0

1

0

1

1

0

0

1

0xF0 1

1

1

1

0

0

0

0

ビット論理積

0

1

0

1

0

0

0

0

!= 0

1になっている一番上の桁は上位4桁のどれか！

●


0

1

0

1

1

0

0

1

0

1

0

1

0

0

0

0

0xCC 1

1

0

0

1

1

0

0

ビット論理積

0

1

0

0

0

0

0

0

●


0

1

0

1

1

0

0

1

0

1

0

1

0

0

0

0

0xCC 1

1

0

0

1

1

0

0

ビット論理積

0

1

0

0

0

0

0

0

!= 0

1になっている一番上の桁は上位2桁のどれか！

●

–

data
data
data
data
data

サンプルコード(32ビット)
=
=
=
=
=

data
data
data
data
data

&
&
&
&
&

0xFFFF0000
0xFF00FF00
0xF0F0F0F0
0xCCCCCCCC
0xAAAAAAAA

?
?
?
?
?

data
data
data
data
data

&
&
&
&
&

0xFFFF0000
0xFF00FF00
0xF0F0F0F0
0xCCCCCCCC
0xAAAAAAAA

:
:
:
:
:

data;
data;
data;
data;
data;

●

ビット列を逆転する
–

高速フーリエ変換などで用いる

data

0

1

0

1

1

0

0

1

dataの逆転

1

0

0

1

1

0

1

0

●

–

これも一気にやるのは無理

data

0

0

1

data&0x55
data&0xAA

1

0

1

1

1
0

0

0

0
1

1
1

0

●


data

0 1 0 1 1 0 0 1

(data&0x55)<<1 1
(data&0xAA)>>1

1
0

0
0

1
1

0

●


data

0 1 0 1 1 0 0 1

(data&0x55)<<1 1
(data&0xAA)>>1

1
0

0
0

1
1

0

ビット論理和

1 0 1 0 0 1 1 0

●


変更前のdata

0 1 0 1 1 0 0 1

変更後のdata

1 0 1 0 0 1 1 0

●


0 1 0 1 1 0 0 1
変更後のdata

1 0 1 0 0 1 1 0

data&0x33
data&0xCC 1 0

1 0

1 0
0 1

●


0 1 0 1 1 0 0 1
変更後のdata

1 0 1 0 0 1 1 0

(data&0x33)<<2 1 0
(data&0xCC)>>2

1 0
1 0

0 1

1 0 1 0 1 0 0 1

●


0 1 0 1 1 0 0 1
1 0 1 0 0 1 1 0

1 0 1 0 1 0 0 1

●


0 1 0 1 1 0 0 1
1 0 1 0 0 1 1 0
1 0 1 0 1 0 0 1
1 0 0 1 1 0 1 0

●


0 1 0 1 1 0 0 1

1 0 0 1 1 0 1 0

●


●

dataは32ビット符号なし型とする

data =
|
data =
|
data =
|
data =
|
data =

((data &
((data &
((data &
((data &
((data &
((data &
((data &
((data &
(data <<

0x55555555)
0xAA555555)
0x33333333)
0xCCCCCCCC)
0x0F0F0F0F)
0xF0F0F0F0)
0x00FF00FF)
0xFF00FF00)
16) | (data

<<
>>
<<
>>
<<
>>
<<
>>
>>

1)
1);
2)
2);
4)
4);
8)
8);
16);

●

１になっているビットの数を数える

●

ビットレベルでハミング距離を取りたい時などに使う

●

素直な実装(int型を32bitと仮定)

int count = 0;
for (int i = 0;i < 32;i++) {
count += (data >> i) & 1;
}

●


●

ちょっと速い実装

int count = 0;
for(; data; data &= data – 1) {
++count;
}
data &= data-1で１になっている一番小さい桁が0になる

●

●

けっこう速い実装
10進数
2進数
1の個数
0
00000000 0
1
00000001 1
2
00000010 1
3
00000011 2
4
00000100 1
...
...
...
255
11111111 8
あらかじめ0~255までの数について1の個数を数えて配列に
入れておく

●


●

けっこう速い実装

int count = 0;
count += table[data & 0xFF];
count += table[(data >> 8) & 0xFF];
table[256] : 1の個数が入った配列

●


●

配列を使った実装はけっこう速い
–

素直な方法の20倍くらい

●


●

配列を使った実装はけっこう速い
–

●

素直な方法の20倍くらい

しかし、さらに倍くらい速い実装が存在する


1

0

1

1

0

1

0

0

各桁の0/1を「その桁の1の個数」と読み替えることができる


1個 0個 1個 1個 0個 1個 0個 0個
各桁の0/1を「その桁の1の個数」と読み替えることができる


1個 0個 1個 1個 0個 1個 0個 0個
0x55

0

1

0

1

0

1

0

1

ビット論理積

0個

1個

1個

0個


1個 0個 1個 1個 0個 1個 0個 0個
0xAA

1

0

1

0

1

0

1

ビット論理積

1個

1個

0個

0個

0


1個 0個 1個 1個 0個 1個 0個 0個
&0xAA 1個
&0x55

1個
0個

0個
1個

0個
1個

0個


1個 0個 1個 1個 0個 1個 0個 0個
1個

1個

0個

0個

0個

1個

1個

0個


1個 0個 1個 1個 0個 1個 0個 0個
1個

1個

0個

0個

0個

1個

1個

0個

足し算

0

1個

1

0個

0

1個

0

0個

2桁ごとに「その2桁にあった1の数」が格納された！！！


1個 0個 1個 1個 0個 1個 0個 0個
0

1個

&0xCC 0

1個

0個

1

&0x33

1

0

0個
1個

0

0個

0
0

1個

0個


1個 0個 1個 1個 0個 1個 0個 0個
0

1個

1

0個

1
0

0

1個

0

0個

0個

0

0個

1個

0

1個


1個 0個 1個 1個 0個 1個 0個 0個
0

1個

1

0個

1
0

0

1個

0

0個

0個

0

0個

1個

0

1個

0

1個

足し算

0

0

1

1個

0

0


1個 0個 1個 1個 0個 1個 0個 0個
0

0

1

1個

&0xF0 0

0

1

1個

0

0

1個

0

&0x0F

0

0

0

1個


1個 0個 1個 1個 0個 1個 0個 0個
0

0

1

1個

0

0

0

1個

0

0

0

1個

0

0

1

1個


1個 0個 1個 1個 0個 1個 0個 0個
0

0

1

1個

0

0

0

1個

0

0

0

1個

0

0

1

1個

0

0個

足し算

0

0

0

0

0

1

●


●

かなり速い実装(dataはunsigned int型)

data =
+
data =
+
data =
+
data =
+
data =
+

(data & 0x55555555)
((data & 0xAAAAAAAA)
(data & 0x33333333)
((data & 0xCCCCCCCC)
(data & 0x0F0F0F0F)
((data & 0xF0F0F0F0)
(data & 0x00FF00FF)
((data & 0xFF00FF00)
(data & 0x0000FFFF)
((data & 0xFFFF0000)

>> 1);
>> 2);
>> 4);
>> 8);
>> 16);

●

こうして、苦労の末我々は爆速で１になっているビットの数を数
えるアルゴリズムを手に入れた！！！

●

●

しかし･･･

●

●

●

しかし･･･
IntelのSIMD拡張命令セット、SSE4.2から、ズバリ｢１になって
いるビットの数を数える｣CPU命令が追加された！(popcnt)

●

●

●

しかし･･･
–

実際ビット演算を使ったアルゴリズムより2倍ほど速い

●

●

●

しかし･･･
–

●

実際ビット演算を使ったアルゴリズムより2倍ほど速い

我々の努力は無駄だった！！！！！

まとめと注意

●
●

ビット演算はうまく使うととても高速
ぱっと見何してるか判りづらいのでバグを埋め込
みやすい
–

ものすごい高速化をする必要のないときは使わ
ないほうが吉

まとめと注意

●
●

ビット演算はうまく使うととても高速
ぱっと見何してるか判りづらいのでバグを埋め込
みやすい
ものすごい高速化をする必要のないときは使わ
ないほうが吉
CPU命令速い！！！！！
–

●

–

本当に高速化したいときはまずこっちを考えるべき

明日使えないすごいビット演算

More Related Content

What's hot (20)

Viewers also liked (15)

Similar to 明日使えないすごいビット演算 (20)

More from 京大マイコンクラブ (20)