――――Japan Association for East Asian Text Processing (JAET)―――― △▼△▼△▼△ 漢 字 文 献 情 報 処 理 研 究 会 △▼△▼△▼△ ▽▲▽▲▽▲▽ メ ー ル マ ガ ジ ン ▽▲▽▲▽▲▽ ―――――――――――― http://www.jaet.gr.jp/ ――――――――――― ========== 東洋学研究・教育の電子化と電脳漢字処理の最新情報 ========== ■□ 2002.3.1 □■ ■□ 第四号 □■ ―[PR]―――――――――――――――――――――――――――――――― ★☆★☆★ Windows中国語処理と電脳東洋学研究の最新マニュアル★☆★☆★ ★☆★☆★ 『電脳中国学II』(本会編、好文出版)絶賛発売中! ★☆★☆★ 詳細は、http://jaet.gr.jp/denchu2/ ---------------------------------------------------------------------- ◇◆◇◆ 機関誌『漢字文献情報処理研究』(好文出版)好評発売中 ◆◇◆◇ 詳細は、http://jaet.gr.jp/denchu2/ ――――――――――――――――――――――――――――――――――― ・メーラーを等幅フォントに設定してください。 ・バックナンバーの閲覧・検索は、http://jaet.gr.jp/mag/ でどうぞ。 ――――――――――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET か ら の お 知 ら せ ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ――――― ■総合情報 ――――― ○「漢情研 2002年春期公開講座」を開催します ┏━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┓ ┃漢┃字┃文┃献┃デ┃ー┃タ┃ベ┃ー┃ス┃最┃前┃線┃ ┗━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┛ ◆特別講師 ●朱岩(書同文科技公司 高級専員) ●朱江(書同文科技公司 市場部経理) ◆日時:2002年3月31日(日) 13時より ◆会場:慶應義塾大学 三田キャンパス 東館6F G-SEC Lab ※『四庫全書』『四部叢刊』のCD-ROM版の開発元として知られる北京書同文 公司から特別講師をお招きし、同社の製品・技術・展望についてお話頂く とともに、我が国の東洋学との連携について討議します。 ※日本語通訳付き。 ◆入場無料 但し非会員の方は、資料代として五百円申し受けます。 ◆要申し込み 参加申し込み・詳細は、以下のURLをご覧ください。 http://jaet.gr.jp/meeting.html ――――――― ■会員向け情報 ――――――― ○会費納入のお願い 2001年度・2002年度会費が未納の方は、出来るだけ早くお振り込みくださ い。振り込み口座はhttp://jaet.gr.jp/JAET-BBS/(会員専用)にてご確 認ください。 ○名簿を発行します 本年三月を目途に、名簿を発送します。住所変更があった方は、入会申し 込みフォームhttp://jaet.gr.jp/ent-form.html、あるいは会費を振り込 まれる際に通信欄にその旨ご記入ください。 ○新入会員(2002.2.11〜2002.2.25) 5名の方が新たにJAETに入会されました。 ====================================================================== 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇JAET-BBS ダ イ ジ ェ ス ト◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ・漢情研会員はリンクをクリックするとJAET-BBSの当該発言を閲覧できます。 ――――――― ■イベント情報 ――――――― ○漢籍データベース協議会第2回総会 と き:2002.3.8(金)14時から ところ:東京都千代田区一ツ橋2-1-2 学術総合センター2階 中会議室 詳 細:http://www.kanji.zinbun.kyoto-u.ac.jp/announcement/kanseki-2.html ○連続公開シンポジウム「21世紀の東方学」第三回「東方学の再構築」 主 催:京都大学人文科学研究所 と き:2002.3.16(土) ところ:京都大学京大会館 詳 細: http://www.zinbun.kyoto-u.ac.jp/symposium/announce.html 第一回目の模様をまとめた冊子(PDF化)が、上記Webページから 閲覧可能。 ○京都大学大型計算機センター 第69回研究セミナー 「東洋学へのコンピュータ利用」 と き: 2002.3.22(金) 10:30〜17:00 ところ: 京都大学大型計算機センター3階講習室 漢情研のメンバーが何名か発表します。 ○EBTIとPNCほかの合同大会 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=546&area=1-1000 EBTI(Electronic Buddhist Text Initiative)とPNC(Pacific Neighborhood Consortium)ほかの合同大会が、9月に大阪で開催予定。 東洋学のコンピュータ利用に関する一大会議。会場など、詳細は未定。 詳 細:PNC http://www.pnclink.org/ EBTI http://www.human.toyogakuen-u.ac.jp/~acmuller/ebti/ ――――――――――――――――――― ■雑談 <電脳・社会・学界をめぐって> ――――――――――――――――――― ○アジアのニュースサイトも日本語で http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=452&area=1-1000 東アジアの新聞サイトにも日本語ページが増えてきました。「人民日報」 の日本語ページは有名ですが、最近は韓国の新聞社の日本語ページも充実 してきているようです。 ―――――――――――――――――――――― ■電脳情報 <Webサイト・ソフトウエア etc.> ―――――――――――――――――――――― ○超星ブラウザ3.6β2 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=573&area=1-1000 超星数字図書館の専用ブラウザ(超星閲覧器)の最新英語版情報です。 ○多言語対応OPAC http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=577&area=1-1000 東京大学附属図書館でUCS対応の多言語版OPACが公開されました。 ○『月刊しにか』で電脳連載 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=437&area=1-1000 『しにか』で当会代表二階堂氏による1年間の連載がはじまる模様です。 ○国学『全唐文』6月発売 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=441&area=1-1000 国学の『全唐文』CD-ROM発売までのスケジュールが固まったようです。 ○北大方正の漢字辞書 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=447&area=1-1000 中国のIT大手、北大方正グループが開発した6万5千字の漢字辞書が日本 で発売され日経ネットなどで話題になっています。 ○最近の雑誌記事から http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=448&area=1-1000 各種雑誌の最新号(「アスキー」「情報処理」「Web Designing」「言語」 「日経バイト」)より漢字、文字コード、ソフトウェアーに関する記事の 情報を提供。 ○近刊情報 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=587&area=1-1000 三上喜貴著『文字符号の歴史―アジア編―』が発売されるようです。 2002.3.16発売予定, 共立出版, ISBN 4-320-12040-X ―――――――――――――――――――――― ■文字処理情報 <テキスト処理と文字コード> ―――――――――――――――――――――― ○GB18030、GBKに関する情報 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=220&area=1-1000 GB18030の規格書の誤りの指摘など、GB18030、GBKに関する情報リソース が紹介されています。 ○小形克宏氏がJCS委員会に提出したレビュー原稿を公開 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=221&area=1-1000 前号(第三号)で小形克宏氏の「文字の海、ビットの舟」に久しぶりに記 事が追加されていることを紹介しましたが、さらに氏がJCS委員会に提出 したレビュー原稿が公開されました。 関連URL:http://www.watch.impress.co.jp/internet/www/column/ogata/sp14/review3.pdf ○ngmergeの妙な動作 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=222&area=1-1000 もろ式 cluster分析の実験で、ngmerge.pl が変な動作をした模様。原因 は事前ソートを忘れたことによるようです。みなさまご注意を、、。 ○異本のクラスター分析実験 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=223&area=1-1000 石井公成氏が仏教教典のクラスター分析で異本処理を行ったところ、時代、 出版地で興味深い結果が出た模様です。 ―気まぐれコラム――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ ウェブ・アーカイヴィングの現状◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 小島浩之 少し前まで紙媒体の独断場であった情報伝達の手段が、今や電子媒体にその地 位を脅かされつつあります。 一口に電子媒体と言ってもCDやDVDなどのオフラインのものから、電子ジャー ナル、Webサイトなどオンラインのものまで多種多様です。この中で情報学や 図書学の世界で、現在現在最も注目を集めているのが、無限にあるWebサイト をどう収集、保存するかということなのです。 読者諸氏は、何故Webサイトなのかと不思議に思われるかもしれません。学術 的に見た場合、Webサイト上の情報はそのほとんどが凡そ学術というものから 無縁の内容です。しかしこれは現在の私たちにとって、そう思えるだけなので あり、数百年、数千年のちの人々にとっては20世紀後半から21世紀にかけての 社会、文化を研究する上で貴重な一次資料となるに違いありません。 先般、国立国会図書館で開催された"ウェブ・アーカイビィングに関する国際 シンポジウム" http://www.ndl.go.jp/ndl_frm_site_7_1_sympo.html は、メ インテーマとして”文化資産としてのウェブ情報”を掲げていましたが、これ はまさに正鵠を得た表現だと思われます。 国立国会図書館の言葉を借用すれば、ウェブ上の資料の整理法には2種類あり ます。一つはWebページを収集し保存してしまうアーカイヴ、二つ目は保存は しないが該当サイトへの案内をするナビゲートです。 アーカイヴ、ナビゲートなどという言葉を使うと仰々しいのですが、簡単で具 体的に説明すれば、google http://www.google.com/intl/ja/ のキャッシュは まさにアーカイヴですし、一般のリンク集や当会が提供するKanhoo http://jaet.gr.jp/kanhoo/index.html はナビゲートに該当するでしょう。 ●法整備とウェブ情報の保存 ところで、Webサイトの収集・保存という話になると、必ず問題となってくる のが著作権の問題です。筆者も法律の専門家ではないので詳しいことは解らな いのですが、保存に関しては法的には何も定まっていないというのが現状のよ うです。ただしその保存データを公開するということになると、著作権だけで はなく公衆送信権の問題も絡んできますので、図書館の場合であれば館内閲覧 に限定しておいた方がいいだろうということになります。 このようにWeb情報の保存、公開を法的に見た場合、現状では白とも黒ともつ け難いというのが実際のところのようです。もちろん国は法整備に手をこまね いているわけではないのですが、法的に整備されるのを待っていては、貴重な 情報をみすみす失うことになってしまいます。従って見切り発車的に保存を進 め、問題が出てきたら個別に対処するというのが世界的な潮流になっているよ うです。googleのキャッシュが堂々と存在している理由がなんとなく解るよう 気がしませんか。 このような状況下で、過去5年間にわたり世界のWebサイトを収集し公開して いるサイトがあります。米国インターネット・アーカイヴ社の提供するIntern et library http://www.archive.org/ がこの驚くべきサイトです。現在、検 索手段はURL指定によるものしかなく、決して使い勝手が良いとは言えません。 しかしURLを指定さえすれば、1996年以降で定期的にロボットが収集した日が 表示され、その日付をクリックすることで、失われたはずの当時のWebサイト が再現されるのです。 前述の国際シンポジウムでは社長のDr. Brewster Kahle氏の講演がありまし た。それによれば、収集の対象となっているのは公的に利用可能なもののみ で、私的なものEメール、チャット等は対象外だということです。また気にな るウィルスチェックは収集時に常時監視しているわけではなく、発見後の対処 になっているとのことです。 ●Web情報と版 これまでWebサイトは常に最新のものが存在しているだけでした。しかしこれ から過去のWebサイトを見ることが可能になると、両者をどう区別するのかと いう問題が生じてきます。特に学術論文に引用する際などには非常に困ったこ とになり、これまで版という概念の無かったWebサイトにこの概念を持ち込ま ねばならないことになります。 漢籍の電子データにしても数種類の電子版本が存在することになります。電子 版本の場合、新しければ新しいほど誤植等の訂正が進むわけですから、より新 しいものが善本となるでしょう。これは古いものほどより善本とするこれまで の版本の感覚と180°逆ですから、面白いですね。"宋紹興本を底本とした電子 版第5版(アクセス日:2002.3.1)"などという版表示が出てくるのもあながち冗 談ではないかもしれません。 また現在は消えてしまったサイトでも、閲覧し引用することができるようにな ります。筆者は最近執筆した論文の中で、中国のあるWebサイトを引用しまし た。ところが出稿の段階になってそのサイトが忽然と消えていたのです。論考 中の一節において重要な部分だったのですが、仕方ないので他の手段でお茶を 濁しました。Webサイトが何らかの形で保存され、閲覧できるようになればこ ういった悲劇?も少なくなるでしょう。ただし保存されているものからの引用 は、いわゆる孫引きになるわけですから、これはどう表現すれば良いのか、、 、、考えれば考えるほど新たな疑問が出てきます。 今回は少し漢字情報ということからは離れた話題になりましたが、いかがでし たか。このウェブ・アーカイヴィングに関して詳しく知りたい方は、前述の国 立国会図書館のサイトや、廣瀬信己「北欧諸国におけるウェブ・アーカイビィ ングの現状と納本制度」(『国立国会図書館月報』490号,2002.1)を参照くだ さい。 【このコラムは不定期掲載です。】 ==Information========================================================= ・このメールマガジンは、講読をお申し込みいただいた方に、無償で送信して おります。 ・このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して 発行しています。http://www.mag2.com/ (マガジンID: 0000083458) ◆登録変更・講読停止 ----- http://jaet.gr.jp/mag/ ◆漢情研入会申し込み ----- http://jaet.gr.jp/guiding.html ====================================================================== ┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ 漢字文献情報処理研究会メールマガジン 第四号 [2002.3.1]┃ ┃ 毎月1日・15日発行┃ ┠─────────────────────────────────┨ ┃ 編集・発行:(c)漢字文献情報処理研究会┃ ┃ 本号編集担当:小島浩之┃ ┠─────────────────────────────────┨ ┃本メールマガジンの内容を、著作権法に定められた範囲を超えて、無断で┃ ┃引用・転載・再利用することを厳禁します。 ┃ ┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛ |