――――Japan Association for East Asian Text Processing(JAET)―――― △▼△▼△▼△ 漢 字 文 献 情 報 処 理 研 究 会 △▼△▼△▼△ ▽▲▽▲▽▲▽ メ ー ル マ ガ ジ ン ▽▲▽▲▽▲▽ ―――――――――――― http://www.jaet.gr.jp/ ――――――――――― ========== 東洋学研究・教育の電子化と電脳漢字処理の最新情報 ========== ■□ 2005.12.15 □■ ■□ 第九十五号 □■ ――――――――――――――――――――――――――――――――――― ・メーラーを等幅フォントに設定してください。 ・バックナンバーの閲覧・検索は、http://jaet.gr.jp/mag/ でどうぞ。 ――――――――――――――――――――――――――――――――――― ―[PR]―――――――――――――――――――――――――――――――― ┏━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┓ ┃漢┃字┃文┃献┃情┃報┃処┃理┃研┃究┃第┃6┃号┃★好評発売中!★ ┗━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┛ ■■□本会機関誌の最新号刊行中!□□□□□□□■■■■ ┌─────────┐ │ 定価:2,200+税 │ ├─────────┤ │ISBN:4-87220-098-5│ └─────────┘ ・最寄りの中国書籍店・書店にてお求め下さい。 ・書店への入荷が困難な場合は、オンライン通販窓口をご利用下さい。 http://jaet.gr.jp/shop/ ・漢情研会員・CCAI会員は、専用窓口にて会員価格にてお求め頂けます。掲示 板・メーリングリストの関連情報をご参照下さい。 ――――――――――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET か ら の お 知 ら せ ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ―――――――――――――――――――――――――――――― ■□漢字文献情報処理研究会第八回大会のお知らせ(再掲)□■ ―――――――――――――――――――――――――――――― 漢情研第八回大会がいよいよ今週末に開催されます。 本年の大会は、日本中国語CAI研究会とのジョイントセミナーとして、 開催されます。 ○日時:2005年12月17日(土) 13:00〜18:00 ○会場:慶應義塾大学日吉キャンパス来往舎中会議室 ○JAET・CCAI会員入場無料(非会員は資料代500円)・参加自由 ■日本中国語CAI研究会大会 ○CCAI総会(10:30〜10:45) ○CCAIセッション ・小川利康(早稲田大学)「講読授業における検索エンジン活用」 (10:45〜11:15) ・清原文代(大阪府立大学)「Podcastと中国語教育(仮題)」 (11:15〜11:45) ○デモ「Chinese Writer V8」(高電社)(11:45〜12:00) (昼休み/Chinese Writer V8体験コーナー 12:00〜13:00) ■日本中国語CAI研究会・漢字文献情報処理研究会 合同企画 ○電子辞書座談会 ・講師:木村一彦氏(セイコーインスツル株式会社パーソナル機器事業 部)(13:00〜14:30) (休憩 14:30〜14:45) ■漢字文献情報処理研究会大会 ○JAETセッション:漢字処理の新時代(仮題) ・秋山陽一郎(京都大学人文科学研究所)「CJK Extension B フォント と検索・入力手段について」(14:45〜15:15) ・上地宏一(慶應義塾大学大学院)「Copyleft + font = Copylefont」 (15:15〜14:45) ・川幡太一(NTTサイバーソリューション研究所)「漢字・甲骨 文字な どに関する標準化の最新動向」(15:45〜16:15) (休憩 16:15〜16:30) ・ディスカッション(16:30〜17:30) ○JAET総会(17:30〜18:00) ※大会後に懇親会を行います(参加申込は締め切りました) ――――――― ■会員向け情報 ――――――― ○【重要】会費納入のお願い 会費未納の方は、出来るだけ早くお振り込みください。 振込口座は http://www.jaet.gr.jp/JAET-BBS/(会員専用)トップページ にてご確認ください。また、会員種別変更(一般・BBS)も随時受付中で す。 ※一般会員で本年度会費が未納の方には、『漢字文献情報処理研究』第6号 が発送されません。早急にお振り込みください。 ○【重要】会員登録情報変更のお願い 異動や引越しなどにより会員登録情報に変更が生じた会員の方は下記のフ ォームより事務局までお知らせ願います。 http://www.jaet.gr.jp/JAET-BBS/change.html(会員専用) 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET-BBS ダ イ ジ ェ ス ト・2005.11.25〜2005.12.10 ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ・漢情研会員はリンクをクリックするとJAET-BBSの当該発言を閲覧できます。 ―――――――――――――――――――――― ■電脳情報 <Webサイト・ソフトウエア etc.> ―――――――――――――――――――――― ○【ブラウザ】Firefox 1.5 いよいよ登場。日本語版も配布開始。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info3&mes=279 ○【書籍】 インターネット図書館 青空文庫 青空文庫の紹介や歴史についての本。DVD-ROMが付属する。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info3&mes=281 ○【サイト】こっそり小説書目テスト中 本会会員の二階堂氏が中国の小説書目データを試験運用中。拡張 漢字まで検索可能とのこと。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info3&mes=284 ―気まぐれコラム――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ 今求められるコンピュータ漢字リテラシー ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 上地 宏一 ■湯水の如くとはいえない多漢字環境 いよいよ2005年最後のメルマガである。約12万字の漢字フォントを来春公 開、というニュースが入ってきて、巷の漢情研をはじめとする多漢字情報処理 分野の研究者コミュニティが賑やかである。 (宣伝もかねてちょっとネタ出し…)今週末の漢情研年次大会では、ISO/IEC 10646の拡張漢字に関する話もあるとのことで、多漢字情報処理に関しては来年 もいろいろ進展がありそうである。 そんな中、とある研究者の次のような話を聞いた。いろいろと考えさせられる ことがあった。少し紹介すると、彼は古典の文章をパソコンに入力しようとし て、出ない漢字に困ってしまったようである。そして、結局入力をあきらめた のであるが、ずいぶんと時間を浪費してしまった、とのことであった。その漢 字というのは、「節」と「并」の旧字体(旧字形)である。 ■「節」という字の旧字体はどうやって入力するのか? 「節」の旧字体、というのは左下の部分が「白/匕」を組み合わせた字 形(1A)のことを意味している。これは諸橋大漢和辞典の字形である。「節」に ついては、Unicodeではコードポイントは1つしかないため、たとえばMingLiU フォントを使えば、「白/匕」ではなくて「食」偏の旧字形の下部分に相当する 字形(1B)が表示できる。 と、この結論を得るのはたやすいことであるのか?いや、意外とそうでもない。 1Aがグリフが無くて、1Bはグリフが得られる、という判断は難しいのではない だろうか。「ISOの規格表を見る」「実際にいくつかのフォントを切り替えてみ る」「CHISE IDS FIND」や「CHISE/linkmap」を見る、「文字パレット」に書い てみる、など、いくつかのチェック項目を組み合わせて初めて判断できるだろ う。 しかし現実には、これらの項目の1つも知らない人がたくさんいるはずである。 IMEに「ふし」と入力して候補に出てこない、という時点であきらめている人も 実際にいる。 今昔文字鏡を使えば1Aがでるはずだ、と考える人もいるであろう。それも解法 の1つである。しかし、巷では7万字の漢字が普通に使える、と言う人たちが いて、そして独自マッピングによる多漢字環境はインターネット時代にはふさ わしくない、と言う人たちがいる。GT明朝もしかりである。かといって、超漢 字OSを使うという解法は現実的ではない。 そんなわけで、「いったい、PCで多漢字環境は実現したの?していないの?」 という心の叫びを聞いた印象を持った。 ■「并」という字の旧字体はどうやって入力するのか? 「并」という字の左右で分離している字形(2A)も入力が難しい字形である。答 えとしては、たとえばMS Pinyin IMEの繁体字入力モードにおいて「bing」とい う読みの候補で現れる。「并」と2Aはソースコードセパレーションの関係で別 のコードが割り振られているため、MingLiUなどのフォント切り替えでは「并」 から2Aは得られない。 近年でこそ、「ソースコードセパレーション」という概念も広く知られるように なってきた。特にWeb検索において日本・中国大陸・台湾で「説」が別のコード になっているけれどもGoogleでは検索できる、ということなどが知られている。 しかしどの字が分離対象なのか、については規格表を参照する必要がある。 ■程遠い多漢字環境 このように、7万字使えますよ、数万字のフォントがありますよ、と言われても、 実際には「湯水のように」多漢字が使える、とは到底言い切れない。もちろん 「旧字形を使う必要性」についても議論があることは承知している。しかし、こ れまで盛んに「多漢字環境」が喧伝されてきた。いざ入力する番になって、「ち ょっと待ってくれ。旧字形は必要か?」と言われるのは納得できない。少なくと も自分が使いたい文字は、すんなりと使いたい、というのが正直な要求である。 ■私見による2つの解法 これまでの文字コード収録漢字の拡張は、ある程度間違っていなかったと私は思 っている。今は、その成果(大規模文字コード)を生かすべく、多漢字を容易に 使いこなせるような入力システムが求められている段階であると私は考える。こ れは、単に大規模漢字の入力を簡単にするだけではなく異体字シソーラスの参照 ・切り替えの機能を装備するものである。そしてデザイン差をフォントの切り替 えで処理するのではなく、普通の異体字切り替えと同様に行えるようにするべき である。この入力システムが専用のアプリケーション・専用のOSに縛られること 無く使えるものが求められている。当然のことながら、細分化された異体字同士 は検索時に互いに関連付けられている必要がある。 そしてもう1点は、現在の多漢字環境に関するさまざまな情報を一つにまとめる ことであり、特に初習者を対象とした自習資料を準備することであると考える。 漢情研は、これまでにいくつかの本を出しているが、さらに具体的事例を多用し、 多漢字入力・操作に特化したコンピュータ漢字リテラシー教材が求められる。そ れが身について初めて、漢字文献の情報処理という領域に踏み込めるのではない だろうか。 ==Information========================================================= ・このメールマガジンは、講読をお申し込みいただいた方に、無償で送信して おります。 ・このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用し て発行しています。http://www.mag2.com/ (マガジンID: 0000083458) ◆登録変更・講読停止 ----- http://jaet.gr.jp/mag/ ◆漢情研入会申し込み ----- http://jaet.gr.jp/guiding.html ====================================================================== ┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ 漢字文献情報処理研究会メールマガジン 九十五号 [2005.12.15]┃ ┃ 毎月1日・15日発行┃ ┠─────────────────────────────────┨ ┃ 編集・発行:(c)漢字文献情報処理研究会┃ ┃ 本号編集担当:上地 宏一┃ ┠─────────────────────────────────┨ ┃本メールマガジンの内容を、著作権法に定められた範囲を超えて、無断で┃ ┃引用・転載・再利用することを厳禁します。 ┃ ┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛ |