MARS for Windowsを使っていると、「なぜ、他の運賃計算ツールのように 『普通に』漢字で駅名・路線名を入力できないの?」という疑問が、 当然のように出てくると思います。
これには、「歴史的な事情」と「本気で作ろうと思った場合の難題」とがあります。 これについてメモをまとめておくことにします。
(ここは丸ごと与太話ですので、お急ぎの方は飛ばしてください^^;)
MARSは今でこそWindows用のパッケージがあります。
そして、かなり古いバージョンのWindowsでも動作します。
(Windows98で確認が取れています。Windows95 は未確認、
Windows 3.1はそのままでは動作不可です。)
このへんのバージョンでは、日本語を入力するための
「仮名漢字変換システム」(IME=input method editorと略されます)
が最初からハードディスクにインストールされ、
すぐに使える状態で工場から出荷されてきます。
しかしながら、「Windowsやデバイスドライバ、 仮名漢字変換などを一通りハードディスクにインストールし、 その上で色々なプログラムを動かす」という使い方が当たり前になったのは、 私の記憶では1994年ごろからです。具体的には、Windows 3.1が大々的に登場し、 多くのメーカーが海外から輸入した安価・高性能な部品の組み合わせでパソコンを作るようになった時期です。
それまでのパソコンは、今ではなかなか信じてもらえないかもしれませんが、 ハードディスクを取り付けていないことが珍しくありませんでした。 そういうマシンではどうしていたのかというと、 フロッピーディスク(今ではこれも滅多に見なくなりました) にMS-DOS(エムエスドス)という小さなOSと必要なソフトウェアを入れておいて、 そのフロッピーでマシンを起動していたのです。
何せ1MB(メガバイト)強しか記録できないフロッピーですので、 色々なソフトウェアを1枚にまとめて入れておくことはできません。 そのため、ワープロソフトを使いたい時は「MS-DOS+仮名漢字変換+ワープロ」 のみが入ったフロッピーで起動し、 そのあと表計算ソフトを使いたくなったときは、 ワープロで打っていた文章をフロッピーに保存し、 「MS-DOS+仮名漢字変換+表計算」 のフロッピーに差し替えてマシンを再起動、 ということがごく当たり前に行われていました。
しかも、仮名漢字変換用の辞書は小さいものでも300KB(キロバイト) くらいはありますので、フロッピーの容量を圧迫します。 そのため、日本語入力が必要ないソフト(たとえばゲームなど) を利用するためのフロッピーには仮名漢字変換システムをあえて入れない、 という判断も、ごく当たり前のことでした。
前置きが長くなりましたが、MARSが産声を上げたのは奇しくも、 この一大転機の最中の1994年です。 新品のマシンを買えばハードディスクにWindowsが入っている、でもその少し前の、 ハードディスクなし・Windowsなしのマシンもごく普通に併存している、 そんな時代でした。
そのため、MARSの開発当初は、 仮名漢字変換が使えない環境でも問題なく使えることが必須条件でした。 このとき、キーボードから入力できるのは半角文字(半角カタカナを含む)だけです。 そこでMARSでは、まず半角カタカナで駅名・路線名を入力できるようにしました。 さらに、ワープロソフトを使う際には当時からローマ字入力の人が多数派でしたから、 半角アルファベットでのローマ字入力もできるようにしました。 もちろん、ハードディスクと仮名漢字変換が使えるマシンでは、 全角のひらがなでも入力できます。
以上、歴史的な事情をまとめてみました。
ですが、初版から優に20年を経過し、 MS-DOSを見ること自体がほとんどなくなった今になっても漢字で入力できないのは、 別のところに理由があります。 それは、「ひとつの駅や路線の読み仮名は正確に1通りに決まるが、漢字にすると、 鉄道会社が社内で使っている公式表記以外の色々な表記が変換候補として出てしまう場合が多々ある」という問題です。
いくつか例を見ていきましょう。
この駅から地下鉄で2駅ほど行ったところに「お茶の水女子大学」があります。 1949年に旧制師範学校から新制大学へと移行する際に、 学園発祥の地であるこの土地から名前をとったそうですが、 なぜか表記は、「お」と「の」をひらがなで書くことになりました。
当然、仮名漢字変換用の辞書には両方の表記が採録されています。 ユーザが表記を正確には記憶していない場合、 どちらの表記でMARSに入力するかわかりません。
この駅名のうち、「2」「ビ」「ル」の3文字は、 横書きにする場合は全角文字でも半角文字でも表記可能です。 あるいは、それほど賢くない仮名漢字変換を使っていると、 ユーザは漢数字を使って「第二」と入力するかもしれません。
コンピュータでの文字の使い方に関する規格書などを読むと、
この場合、カタカナについては規定通りに全角で書けば何も問題は起きませんが、 「2」のほうは、杓子定規に半角で書いてしまうと、 路線図などで駅名を縦書きにしたときに90°回転してしまいます。 従ってこの「2」は、縦書きになってもいいように、全角にしておくほうが無難です。
また、Windowsで通常使われる仮名漢字変換システムの工場出荷時の設定では、
この例のように、同じ表記の駅が2つ以上ある場合があります。 全国の主要鉄道路線が「国鉄」というひとつの事業体に統合される前に、 民営だったそれぞれの鉄道会社が別々に駅名を決めて、 その後も変更されなかったものです。
この場合、紙のきっぷを買うと、両者を区別するために、前者は「(北)福島」、 後者は「(環)福島」と印字されます。 MARSでは、「ふくしま」の読みを入力した際にどちらなのかを訊いてきます。
では、ユーザが「(北)福島」「(環)福島」という表記をそのまま入力しようとしたらどうなるでしょうか。 この場合も前の例の「2」と同じ問題が出てきます。
いくつか例を見てきました。 他にも、駅名とその所在地近辺の住所表記とが食い違っている (四ツ谷駅/東京都新宿区四谷)など、 複数の表記がごちゃ混ぜに使われている例は多々あります。
Yahoo!やGoogleなどの巨大企業のサービスでは、 膨大な手間をかけてこのような情報を集め、 表記の揺れがあっても正確に判断できるような仕組みを作り込んでいます。
ですが、MARSは個人が本業の合間に作っているソフトウェアですので、 それだけの手間はかけられません。 それゆえ今まで、読み仮名で入力することにして問題を避けてきたのです。
しかしながら、MARS陣営も負けてはいられません。 関係者多忙につき、いつ実現するかはお約束できませんが、関係者一同、 いつかは漢字での直接入力ができるようになったらいいなあと考えています。
そこで、来たるべき日に備えて、 「表記の揺れ」に関する情報提供をユーザの皆様にお願いしようと思います。 詳細は「データ募集中」 のページをごらんください。