混沌の廃墟にて -205-

不揃いの表現たち

1993-06-24 (最終更新: 1996-04-26)

[↑一覧] [新着] [ホームページ]


 1バイト文字と2バイト文字の混在を嫌う人がいる。「1バイト文字って何?」と いう質問をする人がいるかもしれないが、例の方が簡単である。即ち、「1」と 「1」の混在である。

 どちらか選択しなければならない場合の指針は多種多様である。確固たるポリ シーを持っている人の中で、私が知っているタイプは2つある。まず、英数の1バ イト文字で書ける所は全部それで書くという人である(細かく分けると、さらに 1バイト文字の前後に空白をあける人と、あけない人に分類できる)。もう一つ のタイプは、全部2バイト文字で書く、という二種類である。

 1バイト文字で書くべきと主張する側の根拠は、割と説得力があったような、お ぼろげな記憶はあるのだが、詳細は覚えていない。

 できるだけ2バイト文字で書く人の考え方は、一時私がそうだったからだいた い分かる。途中で文字コードの切り換えが発生するのが気に入らないのだ。ただ し、改行のようなコントロール文字は1バイト文字になるため、結局全部2バイト にするのは無理なのだが、要するにできるだけ2バイトで書きたいという単純な 発想である。

 必要以上にこれらの文字が混在することを避けるのは簡単だ。プログラムを使 って置き換えればいい。この程度のプログラムなら素人でも1日かけずにちゃん と動くものを作れるはずだ。余計な文字まで空白化するバグを作ったのは誰だっ け、だって? 昔のことはよく覚えていない。(*1)

    *
UNICODEという文字コードがあるが、あれは実に中途半端だと思う。Windows NT で採用されるそうだが、頑張って欲しいものだ。最近はどうも2バイトだと入りき らないので拡張の仕様を作るという良くない噂も聞いている。UNICODEというのは 2バイトに押し込めるというのがウリなんだから、なんとか押し込めて欲しいもの である。

 何が中途半端かという点について、あまり見たことのない考え方かもしれない ので、少し紹介する。皆さんも見た経験があると思うが「−」と「ー」が混在し て書かれている文章というのがある。「コンピュータ」(ーは長音)と書くので はなく、「コンピュ−タ」(−はマイナス)と書くのだ。

 ネットでうっかり「コンピュ−タ」なんて書いたら、「マイナスと長音の区別 も付かんのか」と、場合によっては叩かれまくる結果になる。ところが多分使っ ている人は、区別が付かないのではないかと思うのだ。

 心理学の実験で、次のようなものがある。フォントの関係上、ちょっと効果が わからないかもしれないが、手でこのように書いてみて試して欲しい。

        12
    A  13  C
        14
 この図は、12から縦に読むと、真ん中は13に見え、Aから横に見ると、Bに見 えるのだ。非常に有名な例だから出してみたが、手書きの図が扱えない電子会議 ではあまりよくなかったようだ。次のような例の方がわかりやすいだろう。
     DOS/V
     System V
 当然これは「ドスブイ」「システムブイ」と読む。え、「システムファイブ」 ではないかって? じゃあこれはどうだ。
     Mac IIvi
 「まっくあいあいぶいあい」と読んだあなたは正しい(がそんな奴はいない)。

# ところで、本当は何て読むのだ?

 似た文字を同じコードに割り当てるというのは、確かに一つのアイデアである。 特に、ぱっと見て区別できないような場合には、それは合理的であるという考え 方もある。だから、やるなら徹底するべきだ。また、実際それはコンピュータ以 外のシーンでは普通に行なわれている。例えば4Mbyte-boardという書き方がある。 4MBのボードだ。4MB引くボードと読む奴はいない。これはハイフンなのだ。記号 はマイナスに見えるかもしれないが、ハイフンなのだ。マイナスではない。"-"と いう文字が文脈によってマイナスになりハイフンになるのに、なぜ「−」が長音 になってはいけないのか。一つの明白な理由は「−」と「ー」という独立した文 字コードが既に割り当てられているということだ。ハイフンだけを意味する1バイ ト文字はASCIIにはないのだ。

# 英語の複数型にこだわる人に、4Mならbytesだろう、4Mbytes-boardが正しい、
# という人がいる。これを蛇足という。(*2)
 このような混乱が起きるのは似た文字を別コードにするからである。だから、 長音「ー」も、マイナス「−」も、ダッシュ「―」も、同じ記号を割り当てれば いい。「ロ」と「口」と「□」なんて別にする必要はない。

 lという変数名を使うのを嫌う人が多い。確かにCで、

    for (O = 0; O < 1; O += l) {..}
 なんて書かれると分かりにくい。もっともである。そもそも1とlが別のコード だから混乱するのだ。昔、タイプライターに数字のキーがない時には、lで代用し たが誰も文句は言わなかった。同様に0とOも同じ文字コードにするべきである。 似た文字に同じコードを割り当てるのなら、徹底的にやれ。lと1は同じコードに すればよろしい。区別は付かなくなるが、文脈でどっちか勝手に判断してよいこ とにする。コンパイラがどっちかわからない場合にはエラーにすればよい。

# 本気にする人がいけないので蛇足しておくが、これはjokeである。

    *
 ニフティが掲示している「お知らせ」などの文章が気になることがある。以前 はかなり熱心に文句も付けたし、こう書いてはどうかという例文まで作ってメー ルで連絡したこともあった。しかしそれは一向に改善される気配がなかったし、 実際無視されたのである。修正した方がいいのではないかと指摘した文章はずっ とそのままだった。だから、最近は相当変な表現を見つけても、全く連絡する気 もないし、実際連絡しないことにしている。そのような掲示が未だに直っていな いのは、他の人もそういう指摘はする気がない証拠だろう。例えば、もう何ヶ月、 もしかしたら一年も「コミュニケーション」と「コミニュケーション」が混在し た掲示があるが、これがいつまでそのままであるかは割と興味あることである。(*3)
    *
 1バイトの仮名と2バイトの仮名の混在が気になる。FUNIXのように1バイト仮名 を禁止している所もある。非常に両者の混在にうるさい人がいるのも知っている。 しかし、私は単にそれらが混在することについては、あまりうるさく言わない主 義だ。では何が気になるかというと、93/06/17の「今週のお知らせ」から引用さ せていただくと、次のような掲示がいきなり出てくる。
 >   1  93/06/17    「電子カタログ図書館」(FCATALOG)オープン

 >6月20日(日)より、「電子カタログ図書館」がオープンします
 他のあらゆる「。」が2バイト文字なのに、ここだけ1バイト文字だ。(*4) なぜそうする必要があるのか。理由が全く理解できない。単に不注意としか思え ないのだ。似た例だが、もっと悩ましいのもある。
 >  12  93/06/17    「私のニフティ活用法」大募集

 > 応募方法   :1,000字以上 2,000字以内
 >  賞品     :小冊子収録作品の作者には、10000円相当の記念品
 なぜ文字数の時には「1,000字」のようにコンマを使い、金額は 「10000円」(*5)と 書くのだろうか。誤解のないよう補足しておけば、ニフティが掲示する文章が必 ず金額の区切りにこれを使うというのではない。まず大部分は金額の区切りにコ ンマが使われている。つまり、ここだけ「、」なのだ。なぜなのだろうか。こん なことはわざわざセンター宛メールで聞く気もしない。このような例を使って 「文章表現を参考にして、自分の文章技術の反面教師にする」という内容の「私 のニフティ活用法」を書いて応募したら、選考に残るだろうか。

 しかし、私はあまりうるさく言わない主義なので、この程度なら妥協してもよ い。ニフティの好きなように掲示すればいい。金額を「てん」で区切ろうがカン マで区切ろうが、そんなのは趣味の問題というわけだ。しかし、これだけは止め て欲しいぞと思うのが括弧の書き方である。

 >   6  93/06/17    他ネット接続サービスに「MEDINETが追加されます
 MEDINETの前の括弧"「"は2バイト文字で、後の括弧""は1バイトなのだ。 ちなみに、この項目の掲示は全部そうである。「MEDINET-P、「MEDINET-Fな のだ。きっと商標として登録されているのだと思われる。というのは冗談だが。  そこで、原因を模索するために操作過程を考えてみる。2バイト文字を入力し た後には括弧が2バイト文字、1バイト文字を入力した後には1バイト文字になっ てしまったのかもしれない。この予想は、残念ながら次の反例によって却下され てしまう。
 >   7  93/06/17    NTT通話料金割引サービス「テレジョーズ」の予約申し込みを
 >                  開始

 >NTTオンラインショッピングコーナー」は、 TOPメニュー「12. ショッピング
 >  /アドコーナー」の8.NTT/ネットワーク関連から、…
 括弧の前後だけに注目すると、こうなっている。
    N…ー」は  ー「1…ー」  の8…連から、…
(太字が原文では1バイト文字)

 最後の「関連」の後にある括弧は2バイト文字に挟まれているのに1バイト文字 が使われている。ここだけの説明でよいなら、最初と最後の括弧を揃えたから、 といえばそれで済む話なのだが、だとするといきなり1バイトの""で始めて2バイ トの"」"で終わっているのがなぜか説明ができない。このあたりで模索を挫折さ せておこう。

 ちなみに、この不揃いは「」だけでなく、()でも発生している。

 >  13  93/06/17    フォーラム・ニュース・ダイジェスト( 5月)

 >シアターフォーラム・イベント館(FSHOWBIZ) ではこのたび、ミュージカル
 この表現の")"の後に空白があるが、これについて以前VOPでも話題になったと 思う。2バイト文字の開始位置を揃えるためという理由があったと記憶している。 だとすれば、1バイトの括弧に関しては、この原則が完璧に無視されているのだ が。
    *
 さて、今指摘した程度のことはニフティの掲示するメッセージにはうじゃうじ ゃと動かざること山のごとくある。私としては「これだけは止めて欲しい」と思 っているが、それも個人的な好みに過ぎないのだし、ニフティがそうしたいのだ ったら苦情を言う程のものでもない。これらの表現は、個人的に言わせてもらえ れば、まだ「なんか恥ずかしい書き方だなあ」で済む問題である。括弧が混在し ようがしまいが、文章の意味としては何ら誤解することはないのだ。害はない。

 しかし、さらに根本的に、意味上納得できない表現に遭遇することがある。こ れだけは文句を言いたい。6/17の今週のお知らせの中では、次の表現だ。

 >  13  93/06/17    フォーラム・ニュース・ダイジェスト( 5月)

 >  なお、それぞれの内容の詳細については、各フォーラムへアクセスするか、
 >  「先週までのお知らせ」(OLDAN)、または「オンライン・トゥデイ」(OLT)の
 >  フォーラムニュースをご覧ください。
 フォーラムの利用者は「アクセスする」で、フォーラムニュースを見る人は 「ご覧ください」と敬語にしたのは、なぜか? フォーラムへのアクセスには敬 語は必要ないと判断なさったのでしょうか? :-)

 実際の所は意図的に差別したのではなく、うっかり表現し損ねたのだと解釈し たいものだ。もちろん現実にそう書いてあるのだから、この表現を表現通りに一 方だけの敬意の現われと解釈しても読者に何の責任もない。掲示した側にそうい う意図がないのなら、掲示した側が一方的な不注意である。ただし、この表現は 「敬語を最後にまとめた」という主張であるかもしれない。私にはそうは読めな いが。「アクセスされるか」と書くことはそんなに難しいことか?

 このような差別的な表現は極めて失礼だから書く方も気を遣う。だからかもし れないが、そうしばしば見ることができるものでもない。最近では、FBUNGAKUの SYSOPである小泉氏の発言が、どうしても忘れることができない。フォーラム運営 会議の中での運営方針に関する発言である。SYSOPの間では、ニフティが直接運営 するフォーラムの方針として、注目を集めた会議でもあった。

 >  各会議室は、発言される会員だけでなく、読んで楽しむ会員にとっても有益
 >  な場として提供して参りたいと思います。

    (FBUNGAKU MES(18) 00131,「運営方針について(その2)」
     SCI00225  小泉 秀代氏の発言より)
 発言者は「発言される会員」、読者は「読んで楽しむ会員」と書かれている。

 中学校の文法を復習すると、「される」はサ変動詞の未然形に「れる」という 助動詞が付いたものである。「れる」の意味は「受け身」「自発」「可能」「尊 敬」がある。この中で「可能」は原則として五段活用の動詞に付いた場合とされ ている。文脈上「受け身」「自発」と解釈することは不可能だから、従ってここ では明らかに「尊敬」を意味する敬語として「発言される」と書かれている。

 では、なぜ発言者にのみ尊敬を表現して読者には使わなかったか。仮にこれが うっかりミスだとしても、「読者を軽視しているからだろう」と読者に勘繰られ たら、書いた側は反論できないだろう。

 個人的には、これは単純な書き間違いではないと思う。この当時の議論の様子 としては、FBUNGAKUのアクティブ発言者に対していかに主張できるかというのが 鍵だった。議論の相手はアクティブ発言者である。その回答として出てきた文章 という背景にも注目しなければなるまい。ひたすら低い姿勢で出るべき場面だっ たのである。つい発言者に対して低い姿勢で出てしまったのではないか。

 前後の文章には殆ど「される」の類の敬語が使われていなかった。この発言で もここ一か所だけである。その結果、読者を尊重すると書きつつ、発言者だけ敬 語になるという「建て前と本音の見本」のような事例になってしまったのではな いかと思う。実はこの件は事実を確認しようとしてメールを書く所まで行ったの だが、結局そのメールは出さなかった。

 文脈も発言者の真意も関係なく「差別用語は駄目」だとか、「歌詞は一切引用 不可」ということは徹底しているのに、このように実際に差別していると解釈さ れる危険がある表現に関しては無頓着な世界のようである。多分私も人のことを 言えるほどではないだろう。気を付けよう。


補足

(*1) 2バイト空白文字を1バイト空白文字に置き換えるプログラムを作ったのだが、判定に失敗してしまったために、1バイト空白でない文字まで空白にしてしまい、大量の虫食いログが手元に残ることになった。

(*2) 形容詞的用法の時には複数にしないので4Mbyte-boardで正しい。

(*3) もう一つ知っているのは「フッロピー」という表現で、確か1992年頃からあるのだが、いつまでこのまま掲示しておくか興味があったので黙っていた所、1996年4月の大幅文章変更までずっと残っていた。誰も読んでないのか?

(*4) 原文は1バイト片仮名だが、Netscapeで表示できないためコードを変更している。1バイト片仮名の個所は太字で表示されるはず。

(*5) 原文は1バイト片仮名の「、」。


    COMPUTING AT CHAOS RUINS -205-
    1993-06-24, NIFTY-Serve FPROG mes(6)-278
    FPROG SYSOP / SDI00344   フィンローダ
    (C) Phinloda 1993, 1996