――――Japan Association for East Asian Text Processing(JAET)――――

△▼△▼△▼△     漢 字 文 献 情 報 処 理 研 究 会     △▼△▼△▼△
▽▲▽▲▽▲▽           メ ー ル マ ガ ジ ン           ▽▲▽▲▽▲▽

―――――――――――― http://www.jaet.gr.jp/ ―――――――――――

========== 東洋学研究・教育の電子化と電脳漢字処理の最新情報 ==========

                        ■□    2002.11.1   □■
                        ■□    第二十号    □■

―[PR]――――――――――――――――――――――――――――――――
┏━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┓
┃漢┃字┃文┃献┃情┃報┃処┃理┃研┃究┃第┃3┃号┃★10月10日発売★
┗━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┛
■■□ 本会機関誌最新号の最新刊がついに発売! □□□□□□□■■■■
■■□ http://jaet.gr.jp/jj/ にて、オンライン通販開始 □□□■■■■
■■□ 創刊号・第二号も上記サイトにて販売中 □□□□□□□□■■■■

★Windows中国語処理と電脳東洋学研究の最新マニュアル★
┏━┳━┳━┳━┳━┳━┓
┃電┃脳┃中┃国┃学┃II┃                          本会編・好文出版刊
┗━┻━┻━┻━┻━┻━┛                  http://jaet.gr.jp/denchu2/
お求めはお近くの書店か、オンライン通販窓口http://jaet.gr.jp/shop/にて
―――――――――――――――――――――――――――――――――――

・メーラーを等幅フォントに設定してください。
・バックナンバーの閲覧・検索は、http://jaet.gr.jp/mag/ でどうぞ。

―――――――――――――――――――――――――――――――――――
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
◆◇ JAET か ら の お 知 ら せ ◇◆
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
―――――
■総合情報
―――――
○漢字文献情報処理研究会第5回大会のお知らせ

  ◆日時:2002年12月7日(土)13時より
  ◆会場:花園大学無聖館403教室
          http://www.hanazono.ac.jp/
  ◆入場無料(但し非会員は資料代として500円)・要申し込み(申し込み用
    ページを近日設置予定)

  ◆研究発表(13:00〜14:00)
  ・師茂樹(花園大学専任講師)「花園大学禅デジタルアーカイブ・プロジェ
    クトの構想」
  ・山田崇仁(立命館大学講師)「統計学的手法を利用した先秦文献の分類に
    関する研究―『論語』を例にして―」

  ◆特別セッション「CHISEが開く新しい漢字の世界」(14:30〜16:30)
  ・師茂樹(花園大学専任講師)「CHISEとは何ではないか」
  ・守岡知彦(京都大学人文科学研究所附属漢字情報研究センター助手)
    「XEmacs UTF-2000の紹介」
  ・上地宏一(慶應義塾大学大学院政策・メディア研究科博士課程)
    「漢字字形の自動生成とネットワークフォント」
  ・藤原義久(ATR人間情報科学研究所)「漢字のネットワーク」
  ・江渡浩一郎 (独立行政法人産業技術総合研究所研究員/メディアアーティ
    スト)「漢字構造の可視化 (work in progress)」

  ◆大会後、総会と懇親会があります。

―――――――
■会員向け情報
―――――――
○会費納入のお願い
    2001年度・2002年度会費が未納の方は、出来るだけ早くお振り込みくだ
    さい。振り込み口座はhttp://www.jaet.gr.jp/JAET-BBS/(会員専用)に
    てご確認ください。

○新入会員(2002.10.11〜2002.10.25)
    3名の方が新たにJAETに入会されました。

―――――――
■一般向け情報
―――――――
○『漢字文献情報処理研究』創刊号のPDF版を公開
    本会の機関誌である『漢字文献情報処理研究』創刊号のPDF版を無償公開
    しました。以下のページから閲覧・ダウンロードしてください。
    http://www.jaet.gr.jp/jj/jj1.html
    
    PDF版の閲覧・ダウンロード・印刷は自由ですが、転載・再配布は禁止し
    ます。この他の注意点については、上記ページをご覧ください。

======================================================================
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
◆◇ JAET-BBS ダ イ ジ ェ ス ト・2002.10.11〜10.25 ◇◆
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
・漢情研会員はリンクをクリックするとJAET-BBSの当該発言を閲覧できます。


―――――――――――――――――――
■雑談 <電脳・社会・学界をめぐって>
―――――――――――――――――――
○ 【雑談】中国学会報学界展望
    「日本中国学会報」の学界展望(哲学)に「電脳中国学II」の紹介が。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=839

○ 【雑談】朝日進学特集
    「朝日新聞」の「進学特集」に近藤泰弘会員が「名物先生」として登場
    されていました。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=841

○ 「エバークエスト」って…
    オンラインで多言語対戦が可能なゲーム「エバークエスト」とは?
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=842

○ 【雑談】Webでこっそり拡張漢字B
    拡張漢字Bを使ったWebページ公開をこっそり始めました。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=845

○ Chinese Collections in the Digital Library
    書誌データをどう表記するかの議論が該当論文で展開される。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=852

――――――――――――――――――――――
■電脳情報 <Webサイト・ソフトウエア etc.>
――――――――――――――――――――――
○ 洲本市立図書館古書目録
    淡路島の洲本市立図書館が『洲本市立図書館伝来の古書目録』を公開し
    ています。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=20

○ サーチエンジン「百度」
    中国国内のサーチエンジン「百度」はなかなか使いやすい。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=21

○ 基本典籍庫隋唐五代お試し版
    中国学会で配布されていた「基本典籍庫2・隋唐五代編」の試用版をテ
    ストしてみました。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=22

○ 【雑誌】情報処理10月号に日本語処理記事
    「情報処理」10月号に2本の日本語処理関係の記事が掲載。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=27

○ 【シンポジウム】台湾の近代と日本
    「台湾の近代と日本」という国際シンポジウムが、10月26/27日に中京
    大学で開催されました。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=28

○ ダイナフォントOpenType Pro版情報
    ダイナコムはOpenTypeフォントのプロ版の開発に着手とのこと。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=34

○ Mac OS 10.2でSimsun拡張使えるんすね
    Windowsの拡張漢字用フォントは、Mac OS 10.2でも使用可能。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=35

○ 歴史研究と電算機利用ワークショップ
    10月26日に開催された情報知識学会人文・社会系部会「歴史研究と電算
    機利用ワークショップ」のご案内。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=39

○ 【OS】Redhat Linux 8.0
    最新のRedhat Linux 8.0は、かなり多言語化が進んでいるとのこと。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=44

○ 超漢字岩波新漢語辞典 / MS Office 11
   「岩波新漢語辞典」の超漢字版が発売。またMS Office 11のベータ版が
    登場。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=47

○ CNKIカード
    CNKIには個人カードも存在。どこか代理店となって販売してくれないか。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=info2&mes=49

――――――――――――――――――――――
■文字処理情報 <テキスト処理と文字コード>
――――――――――――――――――――――
○ クラスター分析:新たな手法
    STATISTICAが届いたので、新たな手法でクラスター分析を試みました。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=351

○ DTPの日本語環境に関するセミナー
    11月14日に、JPC Conference 2002が開催されます。
    http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=353

―気まぐれコラム―――――――――――――――――――――――――――

〜〜〜〜〜〜〜〜〜〜〜〜〜〜
◆◇ 画像&テキスト主義 ◇◆
〜〜〜〜〜〜〜〜〜〜〜〜〜〜
                                            二階堂よしひろ@電気漢文箱
                             http://nika01.hum.ibaraki.ac.jp/~nikaido/

■使用可能な漢字数の増大

昨今はOSやソフトの進歩により、いつも使っているワープロやエディタでも、
扱える漢字数が増大してきました。いま使用可能な漢字は、約7万字です。

これまでも、仕組み自体は実はWindows NTの時代から備わっていましたが、
肝心の漢字フォントが無かったために、多漢字機能は使えなかったのです。

しかしOffice XP Proofing Toolsに、Unicodeの拡張漢字AとBの漢字フォント
が付属することになったため、これを購入しさえすれば、多くのソフトで多漢
字文書が作成可能になりました。このフォントが、Mac OS 10.2でも使えるこ
とは、漢情研のBBSでも報告した通りです。

これで、極めて限られたユーザ向けにではありますが、約7万字の漢字を使った
データが公開可能となりました。このため、電気漢文箱のサイトでも、UTF-8ペ
ージにおいても、拡張漢字AとBを使って幾つかの漢字を表示するように変更し
ています。

■意外に出番がない拡張漢字B

このように漢字が増えたのは大変結構なことなのですが・・・。

しかし拡張漢字Bを文字パレットで見ていると、古典漢文に親しんでいる自分で
すら滅多にお目にかからない漢字がほとんどです。「勉強不足だ!」と言われ
ればそれまでですが、正直な話、大半の漢字は読めませんし(汗)。

実際電子テキストを作成していても、拡張漢字Aはまだしも、拡張Bまで使うこ
とはほとんどありません。むろん文字コードとしては使用頻度が低くても定義
している必要があると思いますが、実際に使用するのはせいぜい拡張漢字Aまで
の範囲で、それだけでかなりカバーできてしまうと思います。

それでも無い漢字が存在する、と言われる向きもありますが、そこまでの漢字
となると対応が難しいです。実際にいま拡張漢字はC1とC2が策定されています
が、対応フォントが出てくるまでにはもう少しかかるかと。

自分は拡張漢字Bが出るまでは、そういった漢字は組文字にしていました。とは
いえ、ほとんど出番はありませんでしたが。いったんデータとしては組文字に
して、対応フォントが出てきたら変換する、というのが現実的かもしれません。

もちろん、今昔文字鏡を使うのも有力な選択肢です。

■どこまで反映

それにしても、見ていて圧倒的に多いのは異体字です。漢字の一部分の形が違
う。有名なのは「はしご高」と普通の「高」ですか。(本当はこのメールマガ
ジンでも、多漢字版を用意したいですね。それなら「はしご高」出ますし)

でもこれもどうなんでしょう。明清代の版本を見ていると、同じ本の中にこの
双方が混在している例もあります。ひどい時は同じページに混在してます。こ
れをいちいち分けて表記する必要があるんでしょうか?

古典漢文を扱うわれわれも、日常的に使うのは活字に直された本であったりし
ます。『論語』だって『史記』だってそうです。でも、活字本は多くの場合、
異体字を校正して一般に使われる字体に直してしまったりします。それで不便
は感じません。

中国で出されている活字本などは、「於」も「于」もだいたい一律「于」に統
一していたりして、無茶だなあとは思いますが、それでも読める文献は読めて
しまいます。

もしそれをちゃんと確認したかったら、影印本を見るなり、図書館に行って確
認するなりします。それで問題は無い場合がほとんどです。

電子テキストも、ほぼこの活字本のような扱いでよいのではないでしょうか。

異体字に意義があればともかくですが、だいたいは一般的に通用する字体に直
しても読めます。何より、検索やデータ処理においては、直されている方が格
段に使いやすいです。

■画像&テキスト

ただそれだけだと、もとはどんな漢字であったかが分かりません。ならば、古
典作品については、もとの版本の画像と、それから校正された電子テキストを
組み合わせることにすればよいのではないでしょうか。

ある漢字について、どうしても調べたければ、それがか普通の「高」か「はし
ご高」か、「于」なのか「於」なのか、画像の方を確認すればすむことです。
またその校正の妥当性も確認できるでしょう。

とはいえ、「於」と「于」の場合はさすがに行き過ぎだと思います。ですから、
自分が作成する電子テキストでは、これは分けています。例えば、『全相平話』
のデータなどがそうです。

ただ、いままでは画像の提供というのは大変でした。そもそもインターネット
で画像を使ったら、重くてしょうがない。でもいまやブロードバンドが普及し
ていますし、大量データの送付にも、そう違和感がなくなってきました。

もちろん、すべての電子テキストで、異体字全部を一律に通行のものに直せ、
とは言いません。使われている文字自体に意義があるのなら、忠実に反映すべ
きでしょう。例えば、出土資料の戦国期の資料などがそうであるかもしれませ
ん。

しかし、ほとんどの、普通に活字本にできるような文献であれば、一律に通行
の字形に改めてもよいと思います。そして、確認が必要なら画像データに当た
る、と。実際に多くの電子データが、画像とテキストの方向に動き出していま
す。この方法によって検索の便と、正確な資料の反映という二つの要求を同時
に満足させることができるからでしょう。

最近「本の字形通り」をうたい文句にしたソフトもあったりしますが、これも
どうでしょう。そこまで字形にこだわる必要は毛頭無いと思いますよ。

電子テキストは、実際に打ち出す場面ではプリンタの環境などに左右されるこ
ともあります。厄介なのはレーザプリンタで、これはもう、OSとプリンタ、ソ
フトの組み合わせで限りないパターンがあります。その場合でも、画像データ
が付属していれば、やはり確認しながら作業を進めることができます。

このような数々の利点から、今後は画像&電子テキストによる古籍整理が主流
になっていく、と勝手に予想しています(笑)。

【このコラムは不定期掲載です。】

==Information=========================================================
・このメールマガジンは、講読をお申し込みいただいた方に、無償で送信して
  おります。
・このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して
【このコラムは不定期掲載です。】
  発行しています。http://www.mag2.com/ (マガジンID: 0000083458)

◆登録変更・講読停止 ----- http://jaet.gr.jp/mag/
◆漢情研入会申し込み ----- http://jaet.gr.jp/guiding.html
======================================================================

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃    漢字文献情報処理研究会メールマガジン     第二十号 [2002.11.1] ┃
┃                                             毎月1日・15日発行    ┃
┠─────────────────────────────────┨
┃                             編集・発行:(c)漢字文献情報処理研究会┃
┃                                        本号編集担当:二階堂 善弘┃
┠─────────────────────────────────┨
┃本メールマガジンの内容を、著作権法に定められた範囲を超えて、無断で┃
┃引用・転載・再利用することを厳禁します。                          ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛

Last-modified: 2018-10-20 (土) 15:51:08