蘋果派 Apple Pie


蘋果派 2000年10月


2000年10月30日

Mac OS X Public Beta 試用記

21日に日本での販売が開始された Mac OS X Public Beta をインストールしてまる1週間が経った。当サイトで21日に拙訳を掲載した老地方冰果室Mac OS X 中文化密技兩則の内容を実行したうえで、これまでの試用からわかったことを、以下にまとめた。 (25日に掲載した「Web ブラウザ」の項は加筆訂正した。)

●Web ブラウザ

バンドルされている《Internet Explorer 5.5b3》と、23日に発表された Mac OS X 向けの Carbon 版《iCab Preview 2.2》を使って Web ページをブラウズすることができる。中文 (中国語) フォントをインストールして、Big5・GB それぞれの中文フォントをブラウザできちんと設定すれば、「Big5 / GB でエンコードされたページ」「UTF-8 でエンコードされたページ」「SGML 文字参照形式」という三つの条件いずれの下でも、中文文字セット固有文字の表示はほぼ問題なく行える。ただし上記いずれのブラウザを使っても、ポップアップメニューの中文字は化けてしまう。この文字化けが、Mac OS X ネイティブ環境 (非 Classic 環境) で中文インプットメソッドが使えるようになるころには解消されていることを期待する。

●テキストエディタ

Mac OS X Public Beta 附属の《TextEdit》《Stickies》は、Big5 / GB でエンコードされた書類を正しく開くことができず、文字化けしてしまう。《TextEdit》《Stickies》だけで文字化けを「復元」する方法はなく、解消には Carbon 版アプリケーションとの併用が必要なようだ。Carbon 版《Tex-Edit Plus 4.02a2》では文字化けせず正常に開くことができる。同じく Carbon 版《Jedit 4.0》では、文字コード判定の際 Big5 なら「Shift JIS」、GB 2312 なら (EUC と判断されるが変換せず) 「そのまま」を選べばよい。ただいずれも、Mac OS X Public Beta 環境で使える中文インプットメソッドがないため、中文を中文として直接入力することはできない。

また《TextEdit》《Stickies》で、サードパーティによる中文フォントを使っている部分を選択すると、ハイライトが実際の文字の幅と一致せず短くなる不具合がある。また改行の表示もおかしい。表示と内部処理との間でズレがあるらしい。私の試した範囲では、華康中黒體・華康細宋體・華康細圓體・華康楷書體 (いずれも華康科技 (ダイナラブ) のBig5 繁體中文 TrueType フォント) 、それにフリーウェアの Nice Taipei は例外で、正常に処理されている。前述の華康繁體フォントは、ダイナラブ・ジャパンの《DynaFont TypeMuseum TrueType 100》の「特典」として入手したものだ。ところがこの同じパッケージの特典たる簡体フォント (簡宋体・簡黒体・簡楷・簡倣宋) では正常に処理されない。Mac OS 9 附属の繁體4書体・簡体5書体についてはこの障碍はみられない。もともと現状では、中文はサポート外だから仕方なく、ろくに使えないので実害もあまりないが、中文を正式にサポートするまでには改善してほしい。

●コードコンバータ?

《TextEdit》や《Stickies》 (おそらくフォントパネルを装備した Cocoa アプリケーション一般) は、Mac OS 9 附属の《Chinese Text Converter》に取って代ることになるかもしれない。現状では、書類を開くときのコード変換は中文に対応しない限定的なものだが、編集中は文字のフォントを変えるだけでコード変換できるのだ。Cocoa アプリケーションでの、従来より一歩進んだ Unicode 対応がうかがえる。

《ことえり》で「麥金塔」と入力し、これをマウスでドラッグして選択する。フォントパネルで Taipei を選ぶと、選択した3文字が Taipei フォントの「麥金塔」に変る。Beijing を選ぶと「麥」は変らず、「金塔」が Beijing フォントのそれに変る。Beijing フォントには「麦」はあるが「麥」がないからだ。

逆に「麦金塔」は、3文字とも Beijing フォントに変更・変換できるが、 Taipei フォントを選ぶと「金塔」のみ Taipei に変る。

つまり日本字を選択し、フォントパネルで中文フォントに変更すると、対応する文字 (Unicode で日本字・中文字が包摂統合され符号位置が同じになっている文字) が変換先のフォントの文字セットにある場合、文字化けを見ずに変換できるということだ。対応する文字がない場合は変換前と変らない。(←この箇所は検証不足でした。スクリプトを越えてフォントが変る場合があります。) この場合《Chinese Text Converter》は、「変換できない文字がある」とダイアログボックスで指摘・警告するものの、できあがった文書をみると痕跡すら残さずにその文字がなかったものとして扱ってしまう。それに比べて《TextEdit》のこの振舞いは遙かに実用的で合理的だ。

日本語・繁體中文・簡体中文のいずれからも別の一つに変換することができる。また簡体中文文字セットに含まれる声調符号つきの漢語拼音 (ピンイン) ローマ字も、対応する文字が変換先の文字セットにあれば、変換が可能だ。

Mac OS X が中文を完全にサポートするとき、異体字関係にあるBig5 繁體字 (例「麥」) ←→ GB 簡体字 (例「麦」) の相互コンバートもできるようになれば、中文ユーザにとってのメリットはとても大きい。ちなみに意図したものかどうか、実は《Fireworks 3》のテキストエディタはフォント変更後、入力枠の文字は化けるもののこういった変換をすでに“実現”している。

なおせんピンびんとうに代表される中国関係でよく使う文字もヒラギノ Pro 日本語フォント5書体で扱えるようになった。これらの文字も Big5 繁體中文と (せんピンは GB 簡体中文とも) 相互に変換できる。

●文字セット

Mac OS X Public Beta の日本語フォント・ヒラギノ Pro フォント5書体は、従来の MacJapanese (「漢字Talk 7」文字セット、Ken Lunde『日本語情報処理』のいう「Apple90」) よりも大幅に文字が拡張されている。文字セットは、Adobe-Japan-1-4 のもので、これに含まれない JIS X 0213:2000 の文字は現段階では実装されていないようだ。Mac OS X と Adobe-Japan-1-4、JIS X 0213:2000 の関係については、『小形克宏の「文字の海、ビットの舟」』特別編 Mac OS Xの新フォントと2000JISの関係での、Apple CJK テクノロジー インターナショナルテキストグループの木田泰夫氏などアップル担当者への小形氏によるインタビューに詳しい。

現在のところ、拡張された新しい文字・字形を《ことえり》で入力する方法は、文字パレットの「ユニコード表」から拾う以外にない。《Jedit 4.0》《Tex-Edit Plus》《AppleWorks 6》といった Carbon アプリケーションでは、この方法によっても該当する文字を入力することはできず、外部 (《TextEdit》) からコピー&ペーストをしてもこういった文字は「?」になってしまう。(中文フォントの文字としてはペーストすることができる。)

また Carbon 版の Web ブラウザで、Adobe-Japan-1-4 に含まれるものの Big5 / GB 文字セットに含まれない文字――たとえば図書館を意味する「としょかん」 (U+5715 「囗」の中に「書」) という字――を表示させようとしてもやはり1バイト疑問符「?」になってしまう。

●Classic

Apple Mac OS X サイトでも互換性を確認していた《Dreamweaver 3》《Fireworks 3》のほか、《Magellan》《Netscape 6》といったアプリケーションも Mac OS X Public Beta の Classic 環境で顕著な問題なしに使えるようだ。ただし条件によってはうまく動かないこともあるようだ。日本語の《ATOK13 for Macintosh》、中文の《漢音 (Hanin) 5.0.1》《繁體中文》《簡体中文》の各インプットメソッドも問題なく使える。

蘋果台灣、セミナーで Mac OS X Public Beta 進呈

蘋果台灣 (Apple Taiwan) は27日、「e 世代數位影音曁網路出版應用研討會 (e世代デジタルAV・ネットワークパブリッシングセミナー)」を11月10日午後に台北の複合施設「紐約紐約」で開催すると発表した。このセミナーで Mac OS X Public Beta を参加申込み先着100人に進呈するという。台湾でのMac OS X Public Beta の公式配付は、このようにきわめて限定的な形で始るようだ。このほか《Microsoft Office 2001》や 《QuickTime 5》・《Photoshop 6》の紹介が予定されている。


2000年10月25日

《iCab》《Tex-Edit Plus》中文版

情報窯子23日附記事によると、Web ブラウザ《iCab Preview 2.2》とテキストエディタ《Tex-Edit Plus 4.02》の中文版 (繁體中文) が、FTP サーバ「聖堂」で公開された。iCab 中文版については、iCab 公式サイトからも最小限の構成のパッケージをダウンロードすることができる。


2000年10月21日

Mac OS X 中国語化裏技ふたつ

まもなく Mac OS X Public Beta 日本版の販売が開始される。今度の日本語版で、日本語以外の2バイト文字言語への対応がどうなっているか、現段階ではわからないが、去る9月29日に老地方冰果室に掲載された Mac OS X 中文化密技兩則をおさらいしておこう。もちろんこの記事が対象としたのは、9月13日から配布が始ったバージョンであり、今度の日本バージョンではない。 (以下では原文の冒頭部分は割愛している。)

スクリーンショット:繁體中文オプション附きシステム環境設定

はたして Beta 版の Mac OS X が中文 (中国語) をサポートしているのかどうか、Mac OS X をインストールしたハードディスクを探し回った結果、中文を起動する方法を見つけだした。けれどもベータ版の Mac OS X には中文インプットメソッドがついていないので、中文キーボード表示を起動してもかろうじて形だけ触れたといえる程度に過ぎない。このほか、Mac OS X のテキストエディタ Text Edit は英語・日本語と Unicode とのコード変換にのみ対応しているため、Big5 でエンコードされた (書かれた) 中文の書類を正しく開くことも出来ない。

ここでは簡単に Mac OS X に中文フォントをインストールし、中文キーボードを起動する方法を紹介する。

もし Mac OS X 上で Internet Explorer 5.5 を使って中文の Web ページを見たいのなら、Mac OS 9 にインストールされた中文 TrueType とビットマップのフォント (現在、Mac OS X ではPostScript/ATM形式のフォントはサポートしていない。) を Macintosh HD:Library:Fonts フォルダにコピーして再起動する。この方法により、Internet Explorer の初期設定画面で中文 Web ページの表示に使える中文フォントが現れる。

続いては、システムの設定を変更して、システムの中に隠れている中文キーボードを表示させる方法だ。まず Macintosh HD:Library:Preferences: フォルダの中にある .GlobalPreferences.plist というファイルを見つけなければならない。このファイル名の先頭にピリオドがあり、こういった名称のファイルは UNIX のファイルシステムでは不可視ファイルと見なされ、同じ理由でこうしたファイルは Finder では直接見つけることが出来ない。ご注意いただきたい。

このファイルが見つかったら、Mac OS X の Terminal ツールを使って直接ディレクトリのパスを変更するか、あるいは Classic 環境で BBEdit などのツールを使って書換える必要がある。こうしたファイルが不可視になっているのは、通常重要なシステムファイルだからなので、書換えるときには特に気を付けていただきたい。

スクリーンショット:.GlobalPreferences.plist の編集

.GlobalPreferences.plist を開いたあと、の例のように、 <string>TradChinese</string>と付け加える。

完成・保存すると、地域 (International) 言語 (Language) パネルで中文のオプションが表示される。

■訳註追記■

日本版 Public Beta でも、残念ながら中国語のサポートについての前進は見られないようだ。.GlobalPreferences.plist に、<string>SimpChinese</string> という1行を追加すると、簡体中文が選べるようになる。中文フォントを Mac OS X Public Beta に組込む際には、システムフォント (繁體中文なら「Taipei」、簡体中文なら「Beijing」) をコピーしておく必要がある。こうしておかないと、ブラウザのフォント選択ポップアップメニューに中文フォントの名前がきちんと表示されず、空白のようになってしまう。(2000.10.23)


2000年10月10日

『ユニコード漢字情報辞典』と Unicode の話

この6月に発売された『ユニコード漢字情報辞典』(三省堂) を先日購入した。以前には縁遠く感じられた Unicode も、インターネットの普及や多言語・多漢字処理のニーズの高まり、それに応える製品の登場や各プラットフォームでの漸進的な採用によって、次第に身近な存在になってきた。

世界中のあらゆる言語の文字を一つの文字セットに収録することを目的とするこの Unicode では、中台日韓などで使われる漢字を形により統合化操作 (Unitification) していて、「無視できる字形差を持つ漢字については同一であると認める (包摂する) ことにより1つのコードを付与している」(同書ixページ) 。これは膨大な字数にのぼる漢字にばかり資源を配分して、非漢字言語を圧迫するわけにいかない以上やむを得ない仕様といえる。もっとも Unicode の枠組自体に問題がないわけではない。それにしても Unicode の漢字統合ルールはわかりにくい。

日本字「浅」とその簡体字

たとえば「浅」は U+6D45 という符号位置が割振られている。日本字としての「浅」と、つくりが一画少ない中国大陸の簡体字としての字形 (上図右) とが統合され“同居”している。 これは日本漢字を漢字練習帳と脳味噌に刻みつけて育ち、中国語を簡体字で学んだ人間としては、どうみても「無視できる字形差」とは考えられないが、Unicode ではそう決めてしまっている。 (このため、Unicode (UTF-8) でエンコードするなどして日中 () 混在 Web ページを作る場合、現在の条件では字形の正確な再現が保証されない。規範字形にこだわる教育現場などでは受入れられないだろう。この辺りがクリアできたら日中混在が必要になる分野のインターネットでの発展が加速するように思う。)

銭 钱

そうかと思うと、日本字の「銭」は U+92AD、金偏が簡化偏旁になり旁が一画少ない大陸簡体字の字形「钱」 (上図右)U+94B1 と別のコードが当てられている。日本字「銭」と簡体字「钱」の違いはどうやら「無視でき」ないらしい。

内 內

逆に「内」という字はこの字形の現代日本字・大陸簡体字が U+5185 に同居しているが、U+5167 に台湾・韓国の規格に収録されているいわゆる康煕字典体「內」(上図右) がある。前者は冂+人に分解でき、後者は冂+入に分解できる。

説 說

また「説」は、旁が「ソ+兄」の日本字 (上図左)U+8AAC に、旁が「兌(八+兄)」になっている台湾・韓国の“康煕字典体”が U+8AAA にある。Biaukai (上図右) を除く Mac OS 標準添付の (言換えると《Chinese Language Kit 1.x》の) Big5 フォント (上図中央) では、旁が「ソ+兄」になっていて、日本字との字形差は「言」の第1画の向きくらいだ。「内」と「説」の2組とも通常 Big5 圏では後者が使われる。少なくとも、現行 Mac OS の繁體中文=MacChineseTrad 文字セットでは前者はサポートされていない。このため、日本字と Big5 繁體字との間で Unicode を介した文字コード=コンバータ――たとえば Apple 純正の《Chinese Text Converter》、それに《UniText》や《Unisite》《Magellan》の変換機能――では、期待される結果が得られない。この2組は、見たところ「無視できる字形差」だと思えるが、「ある規格で区別されている漢字は統合化してはならない」(同書 付録6ページ) という原規格分離 (ソースコードセパレーション) と呼ばれる別の原則があるため、別のコードが振られている。実は台湾の CNS 11643-1986 という規格では、「内」と「説」は、現地でよく使われる字形の他に、日本字と同じ字形のものも、その第14面 (原語では「第14字面」) に規定されていた。この原則が適用されたために、統合されていないのだ。

本書以前には、こういった Unicode に収録された個々の漢字についての具体的な情報を図書から得るには、大図書館の禁帯出参考図書としてしか見たことのない『日本工業規格 国際符号化文字集合 (UCS) ―第1部 体系及び基本多言語面 (JIS X 0221-1995) 』 (日本規格協会) という2万5000円もする規格票や、大書店のコンピュータ専門洋書売場で2万円強の値札を付けて鎮座まします The Unicode Standard (Addison-Wesley) にあたるほかなかった。これらの資料は、もともと単なるコード表であるため、あまり調べやすいとは言えない。

5000円する『ユニコード漢字情報辞典』は、一般の小型中型漢和辞典や収録範囲を JIS X 0208 (第1水準・第2水準) の範囲に限定したパソコン=ユーザ向けの漢字字典と比べると高い。けれども、これらの辞字典にない情報が従来の4分の1〜5分の1の費用で、しかも従来より確実かつ手軽に手に入るようになったのだ。

貴重な存在である本書にも、いくつか改善して欲しいことがある。まずは検字 (文字の検索) だが、本文が Unicode 並びそのままに部首ごとの排列になっているのに、例外はあるものの巻末付録の索引もほぼ同じ排列で漢字とコードを63ページにわたって並べている。これはそれほどの意味があるとは思えない。それならば、部首索引は Unicode 順では検索が難しいもののみに限定して、別の部首分類からひけるようにするか、もっとページ数を費やしても〈読みからひける索引〉が附いていたほうが親切だ。分類に使われる部首が何かの判断は難しい場合が多いし、実際に判断が分れる例も多々ある。また部首引きでは、読める字でも必ず画数を数えることになる。さらに実際に索引で字を探すときには、目に入る字と、目的の字の画数を比較させられることになる。たとえば「蘋」と「蔵」とではどちらの画数が多いか瞬時にわかるだろうか。あまりに直感的でないこの方法は私には苦痛としかいいようがない。せめて、画数ごとの先頭の文字に、画数を添書きして欲しいところだ。

〈JIS 第1水準+第2水準+補助漢字 (≒Windows 98 以降の Windows 日本語文字セット)〉と、それに含まれない漢字で色分けがされているが、JIS X 0208 (第1水準・第2水準)・JIS X 0212 (補助漢字)・その他の三つの区別ができた方がよいだろう。たとえば、現行 Mac OS の日本語文字セット「MacJapanese」では補助漢字はサポートしていないし、インターネット上で広く使われる ISO-2022-JP でエンコードする場合扱える日本漢字は JIS X 0208 のものに限られる。従って何らかの形で区分していた方が使いやすい。もっともこれは、各文字に付けられた日本の文字コードの頭に「0-」が附いたなら JIS X 0208、「1-」なら補助漢字と判別できる。

付録「ユニコードによる文字入力のすすめ」は、Windows での Unicode による「多漢字」の使用法のマニュアルとして有益な記事だが、場違いな感じがする。

第一に Web ページや雑誌記事向きであって「辞典」向きとは思えない。版元や編者が本書を新語辞典のような年刊の「逐次刊行物」にするつもりなら別だが、ソフトウェアのバージョンアップと辞典の改訂の速さを比べれば、この原稿がたちまち過去の記録になってしまうのは自明だ。

第二にこの原稿が読者と想定している Windows 98+Microsoft Word / 一太郎ユーザは多数派であっても、本書読者やコンピュータユーザのすべてではない。そもそもこの辞典は『Windowsユニコード漢字情報辞典』ではないはずだ。この意味では、Unicode のエンコードや実装の方法、他の環境とのファイル・情報交換にあたって注意すべき点とその原理的な解説の方がよりふさわしいだろう。(Mac ユーザたる私自身としては Windows 用のいわゆる「Unicode 対応」フォントや IME についてはもう少し詳しく知りたいと思うが、それは本書には求めない。)

以上は編纂に手間のかかる辞書に対してあるいは過分に贅沢な要求かもしれない。特に本書は2万0902字という膨大な数に上る漢字字形の異体字関係を整理した労作だ。ともかく、ようやく手頃な Unicode 漢字の資料が、それも本格的な「辞典」として登場したことをまずは歓迎したい。

ユニコード漢字情報辞典 / ユニコード漢字情報辞典編集委員会編. -- 東京 : 三省堂, 2000. -- xvi, 467, 120p ; 21cm. -- ISBN 4-385-13690-4 : ¥5000

《Magellan 1.4J》

マキエンタープライズが、6日、複数の言語の混在したメールの送受信を可能とした電子メールクライアント《Magellan》の最新版バージョン 1.4J をリリースした。今回から、WordService によるスペルチェック、「前に」ボタンによる返信元メールの表示、コンテクストメニュー、送信メールの検索などに対応した。




蘋果派 = Apple Pie / 瀰瀰 (Meme-Meme)
2000年4月2日 開設
© 2000-2003 瀰瀰網 Meme-Meme.net 版權所有 歡迎連結