混沌の廃墟にて -211-

無意識が選択する (2)

1994-01-12 (最終更新: 1996-05-05)

[↑一覧] [新着] [ホームページ]


 さて、核心の「かな漢字変換のメカニズム」を考察しよう。最初に分類したか な漢字変換の4つの操作を再掲する。

  (1) 読みの入力。
  (2) 変換開始操作。
  (3) 候補の選択。
  (4) 確定操作。
 比較のため、直接入力方式の操作を考えると、
  (1') 漢字に対応するキーを押す。
 これだけである。とても簡単だ。どのキーを押すかさえ覚えていれば!

 表記したい漢字に対応する「キーを押す順番」を覚え、かつ記憶し続ける労力 と、かな漢字変換の操作(1)〜(4)に必要な労力の差はどうなのか。定量的な実験 比較報告は見たことがない。ただし見た記憶がないだけであり、実験は存在する と思われる。

    *
 よくある誤った指摘は、「かな漢字変換は(1)→(2)→(3)→(4)のような順次操 作の繰り返しだから面倒だ」というものである。しかし、かな漢字変換は順次操 作ではなく、並列処理なのだ。(*1)

 人間は様々な作業を同時に行うことができる。もちろん、全力で集中できる処 理は限られている。数学の問題を解きながらプログラムのバグを取るのは、ちょ っと難しい。ともあれ多くの処理は優先度を持ったマルチタスクで行われている。 一人が持っている脳の個数は一つだが、多くのI/O処理は同時に独立して実行でき るし、タイムスライスによって、意識的思考さえ同時に複数行えるのではないか と思うことさえある。

 手で文章を書く時でも、考えてみるとかなりの処理が並行しているものである。 かな漢字変換を使って文章を書く時にも例外ではない。実際、この原稿を書いて いる間も、何度も変換ミスをしているのだが、大抵の場合、変換ミスに気付いた 時点で既に次の読み文字を入力しているのだ。これは、読みの入力と、変換候補 の視認作業が並行している証拠である。モデルを使って示すと、次のようなイメー ジになる。2つの矢印がある。一つは(意味・読み・表記)というイメージ情報から 読みを導出する作業である。もう一つは、画面上に表示された表記を、イメージ の表記と照合する作業である。この2つの処理は、パイプラインによって同時に処 理されている。

    (意味・読み・表記)→読み
         ↑     :
                  +――表記
(注) 実感として、変換結果を確信している時は、表記の確認処理が省略されること がある。

 ここで、かな漢字変換で候補文字列から目的の文字を選択する場合には、脳内 のフォント情報へのアクセスが発生しないことに注目してほしい。かな漢字変換 においては、筆記に必要な形状、筆順などの情報は必要なく、変換結果を見てパ ターン認識することにより、文字を表記できるのである。これは手書きとの大き な差であり、作文時に影響する可能性があることに留意すべきである。

 何かを頭の中で考えている段階は、まだ(意味・読み・表記)を使って思想する レベルに留まり、表記のためのフォント情報へのアクセスは発生しない。その後、 このイメージを筆記するためには、脳内のフォント情報へのアクセスが必須とな るる。この作業は、どれだけ反射的であったとしても、思想する作業とは別のデー タベースへのアクセスという処理を伴うので、新たな負荷となるのである。かな 漢字変換を使って文章を作成することにより、この処理は不要となり、その分の CPU(脳)パワーは思考のような他の処理に回すことができる。これは、かな漢字変 換に慣れるとキーボード入力の方が手書きより楽に文章を作れる可能性を暗示す る。

(注) 要するに、手書きの時は無意識といえども頭のどこかで「漢字をどう書けばい いか」を思い出しているが、かな漢字変換だとその手間が省けるので、頭を別 のことに使えるということ。
    *
 「意識的」とは何なのか考えてみよう。

 人間の記憶には、短期記憶と長期記憶があることが、よく知られている。手元 のメモの電話番号を使って電話をかけるためにボタンを押すが、電話が終わった ら番号をもう忘れている。このように短期的に処理すればよい内容は、短期記憶 というメカニズムで処理されるのである。これに対して、後でいつでも思い出せ るような情報は長期記憶に保存される。

 しかし反射的な操作は、これだけでは説明できない。例えばもぐら叩きでもぐ らが出てきた途端に叩けるのは、もぐらが出た瞬間の画像をいちいち目で判断す るというよりは、目に入った瞬間に既にそれが処理されているという点で無意識 に近いと考えられる。しかし、目から入った画像情報がどこかに保存され、脳内 のどこかにあるデータベースと照合している可能性は高い。

 このような一瞬の高速判断のための記憶も、脳に用意されていると想定してみ る。感じとしてはキャッシュメモリである。記憶の保存時間で分類すると超短期 記憶となる。この、キャッシュという概念を導入すれば、現実に行っている瞬間 的な処理をよく説明できる。実感を思いだしながら、かな漢字変換のメカニズム の説明を以下のように試みる。

(注) 心理学にはキャッシュという概念はおそらく出てこない。今、勝手に創作した 概念なので、ご注意を。

 まず、初心者のうちは、かな漢字変換の(1)〜(4)の操作は、短期記憶を使って 逐次的に処理されている。従って、かな漢字変換は思考の妨げにもなるし、手間 がかかる。

 ところが、熟練度が進むと、この処理はキャッシュを使って行われるようにな る。すると、短期記憶の領域は別に使うことが可能になる。熟練者がかな漢字変 換を使って文章を入力するメカニズムは次のようになる。

 1.まず、文章を頭の中にイメージする。これはキャッシュを通して、一瞬のう ちに短期記憶にコピーされる。文章を練る作業は、短期記憶を使って行われる。

 2.短期記憶に入った情報に基づいて、かな漢字変換の操作を行う。すなわち、 文章に従って、読みを入力する操作である。原則的に、この処理はキャッシュだ けを使い、短期記憶を破壊しない。処理は大別すると2つある。

 (a) 読みを入力して、変換操作を行う。 (b) 変換結果を見て、正しい漢字であることを判断する。

 既に述べたように、(a)と(b)はパイプライン処理として、オーバーラップしな がら同時に進む。オーバーラップの様子は次のようになるだろう。

    (A) まず、文章をイメージする。
        (A-1) 読みを入力する。
        (A-2) 次の読みを入力する。  (B-1) (A-1)の変換結果を確認する。
        (A-3) 次の読みを入力する。  (B-2) (A-2)の変換結果を確認する。
        ...

    (B) 次の文章をイメージする。
        (B-1) ...
 この連鎖的処理によって、文章が作成されるのである。ここで、(A)-(B)…のレ ベルの操作は、短期記憶を使った意識的操作である。(A-n)と(B-n)の操作は、特 に大きなイベントが発生しない限り、キャッシュのみを使った反射的な行動とし て並行に、かつ無意識に実行されるのである。また、(A)-(B)-(C)の主な処理と (A-n)、(B-n)の処理も、並行に行なわれている。

 かな漢字変換の候補がヒットしていれば、選択という操作は必要ない。(B-n)の 処理は軽い負荷の作業として、淡々と反射的に行われる。しかし、かな漢字変換 の問題は、候補がヒットせず、多数の候補から選択を強いられる場合である。こ の場合は、一時的に、普段よりは集中して意識的な操作をせざるを得ない。これ により思考が中断されれば、文章作成を妨害する一因となるはずである。しかし、 かな漢字変換に慣れてくると、よほど手間取った時を別とすれば、候補選択が原 因で文章作成の妨げになっているとは到底思えない。なぜか?

 候補選択の作業は割り込みとして解釈することができる。次に入力すべき読み などの環境情報を一旦待避して、候補選択の操作を行い、その後元の状態に復帰 するのである。この作業に慣れないうちは、手間と時間がかかり、キャッシュだ けでは処理することができない。そこで、短期記憶を利用することになるが、こ れによって、既に短期記憶に入っているはずの文章のイメージという情報が破壊 されてしまう。これが思考の妨げになる理由である。

 ところが、候補選択の操作そのものは定型的であるため、慣れればかなり短時 間で行うことができる。ある程度熟練すれば、候補選択もキャッシュを使って処 理できるようになる。こうなれば、短期記憶は破壊しないから、思考の妨げには ならないのではないか。

 経験的に、候補選択のための割り込み処理中は、普段の変換操作よりは幾分集 中いるようである。その点、意識的と言えなくもないが、この瞬間的な集中はす ぐに消え去ってしまい、割り込み処理が終われば元に復帰できうる。このため、 大局的に見ると、無意識に変換操作をしているのと同じ結果になっている。これ が、熟練者になると、かな漢字変換を行いながら思考を妨げることなく快適に文 章を作成できる理由である。

 このような仕組みを想定すれば、意識的行動と無意識の行動は、2つの特徴によ りファジーに判別できる。まず、記憶の期間。これは、短期間であるほど無意識 な行動とみなすことができる。そして、並列して行われる処理が多いほど、それ ぞれの処理は無意識であるとみなすことができる。これらの特徴に従うと、キャ ッシュを使った並列処理でかな漢字変換が可能になれば、無意識下とみなすこと ができるし、これは体験にも合致する。

(注) フォアグラウンドのプロセスは、普段は割り込みの存在を意識していない。も し意識するとすれば、割り込みが多発したり負荷が高いために「ん、やけに処 理が重いな」と感じる時である。
    *
 経験的にも、かな漢字変換に慣れれば慣れるほど、かな漢字変換の作業はどん どんバックグラウンドに落ち込み、意識せずに文章を書けるようになる。
どんなに慣れても、思い通りの候補がすぐに出ないために苛々することも希に はある。しかし、このような最悪の状況はどのような方法であっても避けるこ とが難しい。手書きで漢字が思い出せないとか、直接入力方式でキー手順を思 い出せないような場合である。 それぞれの方式で、このような苛々が発生する頻度に差があるかどうかは調査す る意味がある。

 経験的にどの程度の処理が無意識に行えるかというと、一発で目的の漢字に変 換できた場合はもちろん、二者選択の候補が一度で目的の漢字にならなかった場 合程度までは全く問題なく無意識にできるようである。例えば、「意外」と「以 外」の変換は無意識に行える。

(注) 「以外」と書くべき所で「意外」と変換されても、その時点で次候補キーを叩 くか、あるいは確定したとしても修正までの操作を反射的に行える。
    *
 人によっては、読みを先に一気に入力しておき、その後おもむろに変換キーを 押す、という操作を好むことがある。この方法では、前述したような無意識下で の変換は不可能かと思われる。なぜなら、読みを全て入力してから変換キーを押 した時点においては、既に最初の方で入力した読みはキャッシュからも短期記憶 からも失われているからだ。変換された文字を確定するためには、もう一度入力 した文章を読まなければならない。これは無意識では処理しかねる作業になる。

 従って、反射的にかな漢字変換を実行するためには、なるべく短い単位で変換 するのが前提となる。特に、現在のかな漢字変換の能力を考慮すれば、変換が必 要な文節単位で変換を行うことが最も適している。

 直接入力方式の支持者が最も強調するのは、操作が反射的なので文章の思考の 妨げにならない、ということだ。この主張には全く異論はない。しかし、かな漢 字変換も、方法を選択した上で熟練すれば、直接入力方式と同じように反射的に 操作できるものであり、現に私がそうしている。直接入力方式支持者が声を高く して主張する程には思考を妨げていないのである。


補足

(*1) 並列処理の方が単一の逐次処理よりも総合的負荷が高くなる可能性はある。


    COMPUTING AT CHAOS RUINS -211-
    1994-01-12, NIFTY-Serve FPROG mes(6)-074
    FPROG SYSOP / SDI00344   フィンローダ
    (C) Phinloda 1994, 1996