初級C言語Q&A(12)

初出: C MAGAZINE 1996年5月号
Updated: 1996-03-12

ビット操作、論理演算

C言語は低レベルの高級言語といわれますが(?)、理由の一つとして、シフトやマスクといったビット操作が比較的簡単に実現していることがあげられます。アセンブラから言語を学んだ場合は、これらの操作はごく簡単なのですが、高級言語からいきなりプログラミングを始めた人には、ビット操作という概念そのものに慣れていないため、分かりにくいかもしれません。

ビット操作

Ａ

　コンピュータの中では、数値は0と1という二つの値で表現されています。たとえば、0と1のいずれかを入れることができる箱があると考えてみてください。これだけでは1と0の2通りの値しか表現できませんが、この箱をいくつか集めて一つの数値だと考えれば、大きな数も表現することができます。

　例えば、このような箱が32個あった場合、それぞれの箱の中に0または1のどちらが入りますから、0と1の入れ方を変えることによって表現できる(区別できる) 種類は、2の32乗、すなわち4294967296通りあります。これはまさに32ビットの符号なし整数が0～4295967295を表現できるという現象に対応しています。

　ビットとは、このそれぞれの箱のことをいいます。従って、各ビットは0あるいは1という二通りの値のいずれかとなります。

    ┌─┬─┬─┬─┬─┬─┬─┬─┬～┬─┬─┬─┬─┐
    │０│１│０│１│０│１│０│１│　│０│１│０│１│
    └─┴─┴─┴─┴─┴─┴─┴─┴～┴─┴─┴─┴─┘
      ↑　↑　↑　↑　↑　↑　↑　↑　～　↑　↑　↑　↑
　　　　　　　      それぞれが、ビット

Ａ

　二項演算子の「 & 」を使います。例えば、下から3番目のビットを調べたい場合には、リストのような操作を行います。1という値は一番下のビットが1ですから、この値を左に n-1ビットシフトすれば、n番目のビットだけが1の値を得ることができます。下から3番目のビットだけ1の数は (1 << 2) ですから、この値との「 & 」を求めることにより、そのビットが1か0かを判断することができます。

    if (a & (1 << 2)) {
        /* 下から3番目のビットが1 */
    } else {
        /* 下から3番目のビットが0 */
    }

Ｑ　【ビットの変更】

　あるビットだけを1か0に変更し、残りのビットを元のままにするにはどうすればよいか。

Ａ

　あるビットだけを1にするにはビット論理演算子の「 | 」を使います。1とのorの結果は常に1となります。そこで、目的のビットだけが 1である数とのorを求めれば、目的のビットだけを変更することができます。次のコードは、 a の値に対して下から7番目のビットを1に変更し、その結果を元の変数である a に代入します。目的のビットが最初から1の場合は、その値は変化しません。

  a |= (1 << 6);

　あるビットだけを0にするには、0との「 & 」は0であることを利用します。1とのandの結果は、元の値が0なら0、1なら1となるため、値を変化しません。従って、目的のビットだけが0である数とのandを求めれば、目的のビットだけを変更することができます。このような定数を得るために、「 ‾ 」演算子を使います。この演算子は、対象とする値のビットを全て反転します。すなわち、1であるビットは0に、0であるビットは1に変更します。

次のコードは、 a の値に対して下から7番目のビットを0に変更し、その結果を元の変数である a に代入します。目的のビットが最初から1の場合は、その値は変化しません。

  a &= ‾(1 << 6);

    1
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│０│０│０│０│０│０│１│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

    1 << 6　：左に６つシフトする
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│１│０│０│０│０│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

  ‾(1 << 6)　：0と1を反転する
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│１│１│１│０│１│１│１│１│１│１│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘


      a　　: aの値
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│Ｊ│Ｉ│Ｈ│Ｇ│Ｆ│Ｅ│Ｄ│Ｃ│Ｂ│Ａ│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

  a & ‾(1 << 6)
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│Ｊ│Ｉ│Ｈ│０│Ｆ│Ｅ│Ｄ│Ｃ│Ｂ│Ａ│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

Ｑ　【ビットの変更】

　いくつかのビットは元の値のままで、残りのビットの値を目的の値に変更したい。どうすればよいか。

Ａ

　このように複数のビットの値だけを変更したい場合は、まず「 & 」で変更したいビットを0にセットしておき、それから「 | 」を使って1にしたいビットを1にします。例えば、変数aの下位4ビット(下から数えて1～4番目のビット)を下からそれぞれ0、0、1、0という値にするには、

    a = (a & ‾0x0f) | 0x4;

　を実行します。

    0x0f
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│０│０│０│１│１│１│１│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

   ‾0x0f
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│１│１│１│１│１│１│０│０│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘


      a　　: aの値
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│Ｊ│Ｉ│Ｈ│Ｇ│Ｆ│Ｅ│Ｄ│Ｃ│Ｂ│Ａ│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

  a & ‾0x0f
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│Ｊ│Ｉ│Ｈ│０│Ｆ│Ｅ│０│０│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

     4
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│０│０│０│０│１│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

  (a & ‾0x0f) & 4
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│Ｊ│Ｉ│Ｈ│０│Ｆ│Ｅ│０│１│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

Ｑ　【ビットの反転】

　特定のビットだけを反転したい。すなわち、そのビットが0なら1、1なら0にしたい。どうすればよいか。

Ａ

　この操作は「 ^ 」という演算子を使って簡単に実現できます。例えば、下位2ビットだけを反転させるには、次のようにします。

    a ^= 3;

Ｑ　【ビット演算子の評価順序】

　次のコードが思った通りに動作しないのはなぜか。

    if ((c1 = getchar()) & (c2 = getchar()) & 0x80) {
        /* EUC漢字コードの処理 */
    }

Ａ

(c1 = getchar()) という式の値は、 c1 の値になります。 (c2 = getchar()) の値は c2 になります。従って、これらの値のandを計算し、さらに0x80という値とのandを求めれば、両方の文字の8ビット目が1である場合を検出できる、と考えたのでしょう。この発想は悪くありません。

　ところが、「 & 」という演算子は、その両辺の評価順序が不定であると決められています。従って、このコードは一見 (c1 = getchar()) が先に実行されるように見えますが、実は (c2 = getchar()) が先に実行されるかもしれないのです。そして、その場合には、この後に行われる漢字コードの処理で、1バイト目と2バイト目が入れ替わってしまうため、思った通りの動作にならないのです。また、元の処理は EOF が戻ってきた場合を想定していないので、どこかでそれを検査する必要がありますが、とりあえず元のコードが期待した動作をするように修正するには、次のようにすればよいでしょう。

    c1 = getchar();
    c2 = getchar();
    if (c1 & c2 & 0x80) {
        /* EUC漢字コードの処理 */
    }

Ｑ　【1のビットの数】

　ある整数の値に含まれているビットが1の個所の数を素早く調べる方法は?

Ａ

　一般的には、テーブルを参照するのが高速です。例えば、1バイト整数に含まれる1のビットの数をテーブルにします。

    table[0] = 0;
    table[1] = 1;
    table[2] = 1;
       :
    table[254] = 7;
    table[255] = 8;

　これを使えば、32ビット整数aのビットが1の個数は、

    table[a & 0xff] + table[(a >> 8) & 0xff] +
      table[(a >> 16) & 0xff] + table[(a >> 24) & 0xff]

　で求めることができます。　もう一つの、割と有名なトリッキーな方法を紹介します。

/* 与えられたintの中の1であるビットの数を返す。
 * 最上位2ビットは利用できない
 */
int numofbits(int bits)
{
    int num;

    num = (bits >> 1) & 03333333333;
    num = bits - num - ((num >> 1) & 03333333333);
    num = ((num + (num >> 3)) & 0707070707) % 077;
    return num;
}

(参考: c.l.c FAQ 20.12)

シフト

Ｑ　【シフト】

　シフトとは何か

Ａ

　ある値をビットの並びとみたてた場合に、それらの並びの順序を変更せずに、全体をずらしてやる操作のことをいいます。例えば、図の場合は、全体を右に一つずらしたことになります。右にずらす方向のシフト操作を右シフト、左にずらす方向のシフトを左シフトと呼んでいます。

    右シフトの場合

　　　　　　┌─┬─┬─┬─┬─┬─┬─┬─┬～┬─┬─┬─┬─┐
シフト前　　│０│１│０│１│０│１│０│１│　│０│１│０│１│
　　　　　　└─┴─┴─┴─┴─┴─┴─┴─┴～┴─┴─┴─┴─┘
　　　　　　 　＼　＼　＼　＼　＼　＼　＼　＼　　　＼　＼　＼　＼　
　　　　　　 　　＼　＼　＼　＼　＼　＼　＼　　　＼　＼　＼　＼　消える
　　　　　　┌─┬─┬─┬─┬─┬─┬─┬─┬～┬─┬─┬─┬─┐
シフト後　　│？│０│１│０│１│０│１│０│　│１│０│１│０│
　　　　　　└─┴─┴─┴─┴─┴─┴─┴─┴～┴─┴─┴─┴─┘


    左シフトの場合

　　　　　　┌─┬─┬─┬─┬─┬─┬─┬─┬～┬─┬─┬─┬─┐
シフト前　　│０│１│０│１│０│１│０│１│　│０│１│０│１│
　　　　　　└─┴─┴─┴─┴─┴─┴─┴─┴～┴─┴─┴─┴─┘
　　　　　　 ／　／　／　／　／　／　／　／　／　／　／　／　／
　　　 消える　／　／　／　／　／　／　／　／　／　／　／　／
　　　　　　┌─┬─┬─┬─┬─┬─┬─┬─┬～┬─┬─┬─┬─┐
シフト後　　│０│１│０│１│０│１│０│　│１│０│１│０│？│
　　　　　　└─┴─┴─┴─┴─┴─┴─┴─┴～┴─┴─┴─┴─┘

C言語では、左シフトの演算子として「 << 」、右シフトの演算子として「 >> 」を用いることになっています。

このように、シフトした結果、一部のビットは外にはみでてしまうので、それらの情報は消滅することになります。逆に、シフトによってできた空きビットには、何を入れるかということが問題になります。

C言語では、左シフトの場合、空いたビットには0を詰めることになっています。右シフトの場合は、シフトする値が符号無し整数型の場合には、空いたビットに 0を詰めることになっています。シフトする値が符号付き整数の場合は、結果は処理系定義となっています。すなわち、あるコンパイラは1を詰めるかもしれないし、別のコンパイラは0を詰めるかもしれません。どちらになるかは、処理系のマニュアルを見てください。

Ｑ　【シフト演算子】

　このコードは値をシフトしているはずなのに、値が変化しない。

    printf("a = %d¥n", a);
    a << 3;
    printf("a = %d¥n", a);

Ａ

　シフト演算子は2項を持つ演算子で、左辺の値を右辺の数値だけシフトした値を式の値とします。「 a << 3 」という式は、 a の値を左に3つシフトさせた値を持ちますが、 a の値そのものは変化しません。 a の値を変えるには「 a = a << 3 」のように結果を代入するか、あるいは「 a <<= 3 」のように代入演算子とシフトを組み合わせたものを使います。

Ｑ　【シフトによる演算】

　次のコードは、2バイトのリトルエンディアンで格納された整数値をファイルから読むものである。(実際のコードは EOF の処理があるため若干複雑だが、問題点とは無関係なので省いてある。)

    c = getc(fp);
    c += getc(fp) * 256;

　しかし、このコードは次のようにした方が処理が速いといわれた。本当か?

    c = getc(fp);
    c += getc(fp) << 8;

Ａ

　多くのプロセッサにおいて、整数値のシフトという処理は単純な機械語の命令に置き換えることができます。掛け算の命令を持っているプロセッサもありますが、最高速でもシフトと同程度で、シフトよりも遅い場合もあります。なぜ掛け算の方がシフトより遅いかというと、掛け算という処理は内部でシフトを組み合わせることによって実現されているからです。

　左に1回シフトするという処理の結果は、元の値を2倍することになります。従って、8回シフトした結果は、2の8乗倍、すなわち256倍と同じになるのです。

　ということは、256を掛けるよりは、左に8シフトした方が処理が速くなるという結論でしょうか。残念ながら、その努力は報われない確率が極めて高いでしょう。なぜなら、最近のコンパイラは昔に比べて随分賢くなったので、256を掛けるというコードがある場合には、もしそれを左シフトに置き換えた方が処理速度が速いのであれば、勝手に置き換えるという程度の工夫は当然のごとく行うようになっているからです。従って、これが本当に速いコードになっているかどうかは、コンパイルした結果を分析しなければ何とも言えません。

　一般論としては、掛け算で書くべき所をわざわざシフトに書き直すのは、コードを分かりにくくする原因となるので、避けるべきです。

　ただ、この例の場合は、整数値をファイルから1バイトずつ読み込んで組み合わせるという処理のはずですから、むしろシフトで書いた方が意味が明確になるという考え方もあります。悪くはありません。

Ｑ　【ローテイト】

　ローテイトを実現する簡単な方法は?

Ａ

C言語にはローテイトに対応する演算子はないので、シフトを組み合わせて実現するか、非標準的なasm文を使うしかありません。

論理演算

Ｑ　【論理演算】

　論理演算とは何か。

Ａ

　真偽値を結果とする演算のことをいいます。具体的には、 && 、 || 、 ! の3つの演算子を使った演算のことです。

　ビット毎の演算子との違いは、論理演算の結果は、0か1のどちらかであるということです。言いかえれば、論理演算とは、0は0、0以外の全ての値は1とみなして1ビット整数のビット演算を行ったのと同じ結果を得ると考えてもよいでしょう。

Ｑ　【!と‾の違い】

　単項演算子の「 ! 」と「 ‾ 」はどこが違うのか。

Ａ

　「 ! 」は、論理演算子の否定とされています。すなわち、その結果は0か1のどちらかとなります。「 ‾ 」はビット毎に反転を行います。結果は元の値の0と1を全て逆転させたものとなります。例えば、１に対するそれぞれの演算子を反映させた結果は図の通りで、違いは一目瞭然です。

    1
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│０│０│０│０│０│０│１│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

   !1
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│０│０│０│０│０│０│０│０│０│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

   ‾1
　　　　　　～┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
　　　　　　　│１│１│１│１│１│１│１│１│１│０│
　　　　　　～┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘

Ｑ　【論理演算子の評価順序】

　次のようなコードを見たことがある。評価順序の問題はないのか?

    if (((c1 = getchar()) >= 0x80) && ((c2 = getchar()) >= 0x80)) {
        /* EUC漢字コードの処理 */
    }

Ａ　C言語のほとんどの演算子は評価順序が不定であるという仕様になっていますが、少しだけ例外のものがあります。論理演算子はその例外であり、常に左から右に評価されることが保証されています。

　従って、このコードの場合は、 && の左側にある ((c1 = getchar()) > 0x80) という式がまず評価されることが間違いないため、 c1 と c2 は期待した順序の値が入ることになります。

(参考) 【&&や||と副作用完了点】

初級C言語Q&A(12)

ビット操作、論理演算

ビット操作

Ｑ　【ビット操作】

Ａ

Ｑ　【ビットの検査】

Ａ

Ｑ　【ビットの変更】

Ａ

Ｑ　【ビットの変更】

Ａ

Ｑ　【ビットの反転】

Ａ

Ｑ　【ビット演算子の評価順序】

Ａ

Ｑ　【1のビットの数】

Ａ

シフト

Ｑ　【シフト】

Ａ

Ｑ　【シフト演算子】

Ａ

Ｑ　【シフトによる演算】

Ａ

Ｑ　【ローテイト】

Ａ

論理演算

Ｑ　【論理演算】

Ａ

Ｑ　【!と‾の違い】

Ａ

Ｑ　【論理演算子の評価順序】