――――Japan Association for East Asian Text Processing(JAET)―――― △▼△▼△▼△ 漢 字 文 献 情 報 処 理 研 究 会 △▼△▼△▼△ ▽▲▽▲▽▲▽ メ ー ル マ ガ ジ ン ▽▲▽▲▽▲▽ ―――――――――――― http://www.jaet.gr.jp/ ――――――――――― ========== 東洋学研究・教育の電子化と電脳漢字処理の最新情報 ========== ■□ 2002.11.1 □■ ■□ 第二十号 □■ ―[PR]―――――――――――――――――――――――――――――――― ┏━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┓ ┃漢┃字┃文┃献┃情┃報┃処┃理┃研┃究┃第┃3┃号┃★10月10日発売★ ┗━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┛ ■■□ 本会機関誌最新号の最新刊がついに発売! □□□□□□□■■■■ ■■□ http://jaet.gr.jp/jj/ にて、オンライン通販開始 □□□■■■■ ■■□ 創刊号・第二号も上記サイトにて販売中 □□□□□□□□■■■■ ★Windows中国語処理と電脳東洋学研究の最新マニュアル★ ┏━┳━┳━┳━┳━┳━┓ ┃電┃脳┃中┃国┃学┃II┃ 本会編・好文出版刊 ┗━┻━┻━┻━┻━┻━┛ http://jaet.gr.jp/denchu2/ お求めはお近くの書店か、オンライン通販窓口http://jaet.gr.jp/shop/にて ――――――――――――――――――――――――――――――――――― ・メーラーを等幅フォントに設定してください。 ・バックナンバーの閲覧・検索は、http://jaet.gr.jp/mag/ でどうぞ。 ――――――――――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET か ら の お 知 ら せ ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ――――― ■総合情報 ――――― ○漢字文献情報処理研究会第5回大会のお知らせ ◆日時:2002年12月7日(土)13時より ◆会場:花園大学無聖館403教室 http://www.hanazono.ac.jp/ ◆入場無料(但し非会員は資料代として500円)・要申し込み(申し込み用 ページを近日設置予定) ◆研究発表(13:00〜14:00) ・師茂樹(花園大学専任講師)「花園大学禅デジタルアーカイブ・プロジェ クトの構想」 ・山田崇仁(立命館大学講師)「統計学的手法を利用した先秦文献の分類に 関する研究―『論語』を例にして―」 ◆特別セッション「CHISEが開く新しい漢字の世界」(14:30〜16:30) ・師茂樹(花園大学専任講師)「CHISEとは何ではないか」 ・守岡知彦(京都大学人文科学研究所附属漢字情報研究センター助手) 「XEmacs UTF-2000の紹介」 ・上地宏一(慶應義塾大学大学院政策・メディア研究科博士課程) 「漢字字形の自動生成とネットワークフォント」 ・藤原義久(ATR人間情報科学研究所)「漢字のネットワーク」 ・江渡浩一郎 (独立行政法人産業技術総合研究所研究員/メディアアーティ スト)「漢字構造の可視化 (work in progress)」 ◆大会後、総会と懇親会があります。 ――――――― ■会員向け情報 ――――――― ○会費納入のお願い 2001年度・2002年度会費が未納の方は、出来るだけ早くお振り込みくだ さい。振り込み口座はhttp://www.jaet.gr.jp/JAET-BBS/(会員専用)に てご確認ください。 ○新入会員(2002.10.11〜2002.10.25) 3名の方が新たにJAETに入会されました。 ――――――― ■一般向け情報 ――――――― ○『漢字文献情報処理研究』創刊号のPDF版を公開 本会の機関誌である『漢字文献情報処理研究』創刊号のPDF版を無償公開 しました。以下のページから閲覧・ダウンロードしてください。 http://www.jaet.gr.jp/jj/jj1.html PDF版の閲覧・ダウンロード・印刷は自由ですが、転載・再配布は禁止し ます。この他の注意点については、上記ページをご覧ください。 ====================================================================== 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET-BBS ダ イ ジ ェ ス ト・2002.10.11〜10.25 ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ・漢情研会員はリンクをクリックするとJAET-BBSの当該発言を閲覧できます。 ――――――――――――――――――― ■雑談 <電脳・社会・学界をめぐって> ――――――――――――――――――― ○ 【雑談】中国学会報学界展望 「日本中国学会報」の学界展望(哲学)に「電脳中国学II」の紹介が。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=839 ○ 【雑談】朝日進学特集 「朝日新聞」の「進学特集」に近藤泰弘会員が「名物先生」として登場 されていました。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=841 ○ 「エバークエスト」って… オンラインで多言語対戦が可能なゲーム「エバークエスト」とは? http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=842 ○ 【雑談】Webでこっそり拡張漢字B 拡張漢字Bを使ったWebページ公開をこっそり始めました。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=845 ○ Chinese Collections in the Digital Library 書誌データをどう表記するかの議論が該当論文で展開される。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=852 ―――――――――――――――――――――― ■電脳情報 <Webサイト・ソフトウエア etc.> ―――――――――――――――――――――― ○ 洲本市立図書館古書目録 淡路島の洲本市立図書館が『洲本市立図書館伝来の古書目録』を公開し ています。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=20 ○ サーチエンジン「百度」 中国国内のサーチエンジン「百度」はなかなか使いやすい。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=21 ○ 基本典籍庫隋唐五代お試し版 中国学会で配布されていた「基本典籍庫2・隋唐五代編」の試用版をテ ストしてみました。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=22 ○ 【雑誌】情報処理10月号に日本語処理記事 「情報処理」10月号に2本の日本語処理関係の記事が掲載。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=27 ○ 【シンポジウム】台湾の近代と日本 「台湾の近代と日本」という国際シンポジウムが、10月26/27日に中京 大学で開催されました。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=28 ○ ダイナフォントOpenType Pro版情報 ダイナコムはOpenTypeフォントのプロ版の開発に着手とのこと。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=34 ○ Mac OS 10.2でSimsun拡張使えるんすね Windowsの拡張漢字用フォントは、Mac OS 10.2でも使用可能。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=35 ○ 歴史研究と電算機利用ワークショップ 10月26日に開催された情報知識学会人文・社会系部会「歴史研究と電算 機利用ワークショップ」のご案内。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=39 ○ 【OS】Redhat Linux 8.0 最新のRedhat Linux 8.0は、かなり多言語化が進んでいるとのこと。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=44 ○ 超漢字岩波新漢語辞典 / MS Office 11 「岩波新漢語辞典」の超漢字版が発売。またMS Office 11のベータ版が 登場。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=47 ○ CNKIカード CNKIには個人カードも存在。どこか代理店となって販売してくれないか。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=49 ―――――――――――――――――――――― ■文字処理情報 <テキスト処理と文字コード> ―――――――――――――――――――――― ○ クラスター分析:新たな手法 STATISTICAが届いたので、新たな手法でクラスター分析を試みました。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=351 ○ DTPの日本語環境に関するセミナー 11月14日に、JPC Conference 2002が開催されます。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=353 ―気まぐれコラム――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ 画像&テキスト主義 ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜 二階堂よしひろ@電気漢文箱 http://nika01.hum.ibaraki.ac.jp/~nikaido/ ■使用可能な漢字数の増大 昨今はOSやソフトの進歩により、いつも使っているワープロやエディタでも、 扱える漢字数が増大してきました。いま使用可能な漢字は、約7万字です。 これまでも、仕組み自体は実はWindows NTの時代から備わっていましたが、 肝心の漢字フォントが無かったために、多漢字機能は使えなかったのです。 しかしOffice XP Proofing Toolsに、Unicodeの拡張漢字AとBの漢字フォント が付属することになったため、これを購入しさえすれば、多くのソフトで多漢 字文書が作成可能になりました。このフォントが、Mac OS 10.2でも使えるこ とは、漢情研のBBSでも報告した通りです。 これで、極めて限られたユーザ向けにではありますが、約7万字の漢字を使った データが公開可能となりました。このため、電気漢文箱のサイトでも、UTF-8ペ ージにおいても、拡張漢字AとBを使って幾つかの漢字を表示するように変更し ています。 ■意外に出番がない拡張漢字B このように漢字が増えたのは大変結構なことなのですが・・・。 しかし拡張漢字Bを文字パレットで見ていると、古典漢文に親しんでいる自分で すら滅多にお目にかからない漢字がほとんどです。「勉強不足だ!」と言われ ればそれまでですが、正直な話、大半の漢字は読めませんし(汗)。 実際電子テキストを作成していても、拡張漢字Aはまだしも、拡張Bまで使うこ とはほとんどありません。むろん文字コードとしては使用頻度が低くても定義 している必要があると思いますが、実際に使用するのはせいぜい拡張漢字Aまで の範囲で、それだけでかなりカバーできてしまうと思います。 それでも無い漢字が存在する、と言われる向きもありますが、そこまでの漢字 となると対応が難しいです。実際にいま拡張漢字はC1とC2が策定されています が、対応フォントが出てくるまでにはもう少しかかるかと。 自分は拡張漢字Bが出るまでは、そういった漢字は組文字にしていました。とは いえ、ほとんど出番はありませんでしたが。いったんデータとしては組文字に して、対応フォントが出てきたら変換する、というのが現実的かもしれません。 もちろん、今昔文字鏡を使うのも有力な選択肢です。 ■どこまで反映 それにしても、見ていて圧倒的に多いのは異体字です。漢字の一部分の形が違 う。有名なのは「はしご高」と普通の「高」ですか。(本当はこのメールマガ ジンでも、多漢字版を用意したいですね。それなら「はしご高」出ますし) でもこれもどうなんでしょう。明清代の版本を見ていると、同じ本の中にこの 双方が混在している例もあります。ひどい時は同じページに混在してます。こ れをいちいち分けて表記する必要があるんでしょうか? 古典漢文を扱うわれわれも、日常的に使うのは活字に直された本であったりし ます。『論語』だって『史記』だってそうです。でも、活字本は多くの場合、 異体字を校正して一般に使われる字体に直してしまったりします。それで不便 は感じません。 中国で出されている活字本などは、「於」も「于」もだいたい一律「于」に統 一していたりして、無茶だなあとは思いますが、それでも読める文献は読めて しまいます。 もしそれをちゃんと確認したかったら、影印本を見るなり、図書館に行って確 認するなりします。それで問題は無い場合がほとんどです。 電子テキストも、ほぼこの活字本のような扱いでよいのではないでしょうか。 異体字に意義があればともかくですが、だいたいは一般的に通用する字体に直 しても読めます。何より、検索やデータ処理においては、直されている方が格 段に使いやすいです。 ■画像&テキスト ただそれだけだと、もとはどんな漢字であったかが分かりません。ならば、古 典作品については、もとの版本の画像と、それから校正された電子テキストを 組み合わせることにすればよいのではないでしょうか。 ある漢字について、どうしても調べたければ、それがか普通の「高」か「はし ご高」か、「于」なのか「於」なのか、画像の方を確認すればすむことです。 またその校正の妥当性も確認できるでしょう。 とはいえ、「於」と「于」の場合はさすがに行き過ぎだと思います。ですから、 自分が作成する電子テキストでは、これは分けています。例えば、『全相平話』 のデータなどがそうです。 ただ、いままでは画像の提供というのは大変でした。そもそもインターネット で画像を使ったら、重くてしょうがない。でもいまやブロードバンドが普及し ていますし、大量データの送付にも、そう違和感がなくなってきました。 もちろん、すべての電子テキストで、異体字全部を一律に通行のものに直せ、 とは言いません。使われている文字自体に意義があるのなら、忠実に反映すべ きでしょう。例えば、出土資料の戦国期の資料などがそうであるかもしれませ ん。 しかし、ほとんどの、普通に活字本にできるような文献であれば、一律に通行 の字形に改めてもよいと思います。そして、確認が必要なら画像データに当た る、と。実際に多くの電子データが、画像とテキストの方向に動き出していま す。この方法によって検索の便と、正確な資料の反映という二つの要求を同時 に満足させることができるからでしょう。 最近「本の字形通り」をうたい文句にしたソフトもあったりしますが、これも どうでしょう。そこまで字形にこだわる必要は毛頭無いと思いますよ。 電子テキストは、実際に打ち出す場面ではプリンタの環境などに左右されるこ ともあります。厄介なのはレーザプリンタで、これはもう、OSとプリンタ、ソ フトの組み合わせで限りないパターンがあります。その場合でも、画像データ が付属していれば、やはり確認しながら作業を進めることができます。 このような数々の利点から、今後は画像&電子テキストによる古籍整理が主流 になっていく、と勝手に予想しています(笑)。 【このコラムは不定期掲載です。】 ==Information========================================================= ・このメールマガジンは、講読をお申し込みいただいた方に、無償で送信して おります。 ・このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して 【このコラムは不定期掲載です。】 発行しています。http://www.mag2.com/ (マガジンID: 0000083458) ◆登録変更・講読停止 ----- http://jaet.gr.jp/mag/ ◆漢情研入会申し込み ----- http://jaet.gr.jp/guiding.html ====================================================================== ┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ 漢字文献情報処理研究会メールマガジン 第二十号 [2002.11.1] ┃ ┃ 毎月1日・15日発行 ┃ ┠─────────────────────────────────┨ ┃ 編集・発行:(c)漢字文献情報処理研究会┃ ┃ 本号編集担当:二階堂 善弘┃ ┠─────────────────────────────────┨ ┃本メールマガジンの内容を、著作権法に定められた範囲を超えて、無断で┃ ┃引用・転載・再利用することを厳禁します。 ┃ ┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛ |