――――Japan Association for East Asian Text Processing(JAET)―――― △▼△▼△▼△ 漢 字 文 献 情 報 処 理 研 究 会 △▼△▼△▼△ ▽▲▽▲▽▲▽ メ ー ル マ ガ ジ ン ▽▲▽▲▽▲▽ ―――――――――――― http://www.jaet.gr.jp/ ――――――――――― ========== 東洋学研究・教育の電子化と電脳漢字処理の最新情報 ========== ■□ 2002.7.1 □■ ■□ 第十二号 □■ ―[PR]―――――――――――――――――――――――――――――――― ★☆★☆★ Windows中国語処理と電脳東洋学研究の最新マニュアル★☆★☆★ ★☆★☆★ 『電脳中国学II』(本会編、好文出版)絶賛発売中! ★☆★☆★ 詳細は、http://jaet.gr.jp/denchu2/ ---------------------------------------------------------------------- ◇◆◇◆ 機関誌『漢字文献情報処理研究』(好文出版)好評発売中 ◆◇◆◇ 詳細は、http://jaet.gr.jp/jj/ ――――――――――――――――――――――――――――――――――― ・メーラーを等幅フォントに設定してください。 ・バックナンバーの閲覧・検索は、http://jaet.gr.jp/mag/ でどうぞ。 ――――――――――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET か ら の お 知 ら せ ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ――――――― ■会員向け情報 ――――――― ○【重要】BBS用IDおよびパスワードの再発行について(再掲) 4月14日(日)に、システム上の都合により全会員のアカウントを再発行 しました。新規アカウントの連絡を着信していない方は、JAET入会申し込 みフォーム http://www.jaet.gr.jp/ent-form.html で、入会申請理由欄 に「新規アカウント未着」と明記の上、大至急、メールアドレスおよび住 所をお知らせください。 ○会費納入のお願い 2001年度・2002年度会費が未納の方は、出来るだけ早くお振り込みくだ さい。振り込み口座はhttp://www.jaet.gr.jp/JAET-BBS/(会員専用)に てご確認ください。 ○新入会員(2002.6.11〜2002.6.25) 4名の方が新たにJAETに入会されました。 ====================================================================== 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ JAET-BBS ダ イ ジ ェ ス ト・2002.6.11〜6.25 ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ・漢情研会員はリンクをクリックするとJAET-BBSの当該発言を閲覧できます。 ――――――――――――――――――― ■雑談 <電脳・社会・学界をめぐって> ――――――――――――――――――― ○【雑談】タブレットPCは上手くいかないのでは? MS主導のタブレットPCははたして普及するか。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=ac2&mes=679 ―――――――――――――――――――――― ■電脳情報 <Webサイト・ソフトウエア etc.> ―――――――――――――――――――――― ○【超漢字】 高精細版超漢字システム パーソナル・メディアから超漢字の高精細版超漢字システムが発売。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=809 ○孫中山数字図書館 書同文が開発担当の孫中山数字図書館はすでに公開されている。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=814 ○国立国会図書館Web-OPAC 国立国会図書館のWeb-OPACでは、すでに1948年以降の和書が検索可能に。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=815 ○【ソフト】超漢字4英語化キット 超漢字4の英語・エスペラント対応キットが提供されるとのこと。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=817 ○Red Office 1.2 中国独自オフィススイートRedOfficeとは、OpenOfficeの中文化バージョ ン。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=818 ○大中華蔵書文庫 中国の古典やその他を集めた大中華蔵書文庫なるCD-ROMが。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=819 ○【サイト】AAA! CAFE が「N-gram」方式採用 AAA! CAFEの検索サービスで、従来の「形態素解析方式」にかわって 「N-gram方式」を採用。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=820 ○【雑誌】日経バイト7月号 日経バイト7月号の特集は「セキュリティ法律相談室」。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=827 ○『最新WindowsDTP標準テキスト』 『最新WindowsDTP標準テキスト』の内容は専門的すぎず、なかなか。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=web2&mes=830 ―――――――――――――――――――――― ■文字処理情報 <テキスト処理と文字コード> ―――――――――――――――――――――― ○秀丸エディタも多言語対応 秀丸がUnicode対応に続いて多言語対応も。ただ使い勝手にやや難あり。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=289 ○InDesignでXML InDesignのXML対応や、多言語機能について。 http://jaet.gr.jp/JAET-BBS/contents.cgi?room=code2&mes=290 ―気まぐれコラム――――――――――――――――――――――――――― 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 ◆◇ UTF-8サイトは増える? ◇◆ 〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜 二階堂よしひろ@電気漢文箱 http://nika01.hum.ibaraki.ac.jp/~nikaido/ ■多言語サイトの作成は簡単 「インターネットで国際化」などと言われておりますが、意外に多くのWebサ イトは単一言語で記述されています。複数言語の場合でも、大半は「英語プラ スアルファ」というだけで、到底マルチリンガル対応とは呼べないものでした。 しかし、現在はユニコードを使えば、多言語混在のページは容易に作成可能と なっています。たとえば日本語と韓国語と中国語を混在させたWebページを作 成することは、簡単にできます。 また、使用できる漢字数が増えていますので、多漢字文書のデータを公開する こともできます。たとえば中国の古典作品も、標準的なものであれば、外字や 画像を使わずに表示可能です。 こういったWebサイトは、ユニコードの変形であるUTF-8を使って作成すること ができます。Front PageやNetscape ComposerなどのWebページ作成ソフトは、 新しいバージョンであればUTF-8に対応していますので、これらを使えば多言 語混在ページが作成できるのです。 ■問題は閲覧 しかし問題は、作成よりもそのページを閲覧する、ということにありました。 Internet ExplorerやNetscape Navigatorなどのブラウザは早くからUTF-8に対 応していました。しかし、誰もがみな新しいブラウザを使っているとは限りま せん。また、ある言語を表示するにはその言語のフォントがコンピュータにセ ットされていなければなりませんが、これも大半のユーザは対応していない状 況でした。 印刷文書と異なり、Web文書は閲覧するユーザの環境に左右されます。ユーザ 側はWindowsを使っているかもしれませんし、Mac OSかもしれませんし、Linux かもしれません。そういった状況では、UTF-8で多言語Webページを作成しても、 確実にユーザが読めるかどうかの保証はありませんでした。 ただ、最近は状況が変化してきました。各OSが多言語に対応を進めた結果、新 しいバージョンを使えば、それほど苦労しなくてもUTF-8が使えるようになっ たのです。 特にWindows XPは多くの言語のフォントやIMEを備えており、そのままで多言 語が使えるようになっています。Mac OSはいったん多言語対応については後退 しましたが、バージョン10.1.3以降では柔軟に対応するようになりました。 Linuxも、現在はGnomeやKDEなどのデスクトップ環境を中心に、多言語化が進 んでいます。超漢字も4からはUTF-8が使えます。 つまりほとんどのOSでは、最新環境を使うという前提のもとですが、多言語 Webサイトを閲覧出来るようになっているのです。 ■増加するUTF-8サイト この流れを受けて、UTF-8を使って多言語を表示するサイトが次々と現れてい ます。 特に、検索エンジンの定番であるGoogle(http://www.google.com)がUTF-8に 対応したことは、大きな出来事だと思います。 Googleを使ってデータを検索してみてください。設定と検索語によっては、日 本語と中国語と韓国語などが同時に出力されてくる場合があります。しかも、 1ページの中にハングルや中国語の簡体字などが混在されていると思います。 今後、こういったページはますます増えていくと思います。 しかし、このようにUTF-8ページが一般化する一方、その使い方や意義につい て、今ひとつ認識が薄いように思えます。用途が特殊だからでしょうか、パソ コン雑誌やマニュアル本でも、解説したものは少ないと思われます。またUTF-8 ページを公開しているサイトでも、多言語や多漢字を意識しているとは思えな いところが多いようです。 筆者のサイト「電気漢文箱」などでは、ほぼすべてのページについて、シフト JISとUTF-8の2種類を用意しています。これは多漢字を使った文書をUTF-8を使 って公開する一方、UTF-8の環境を持っていないユーザのために、シフトJISの ページも用意しているためです。ただこのような処理は過渡的なものだと思っ ています。いずれはUTF-8に一本化していくべきでしょう。 【このコラムは不定期掲載です。】 ==Information========================================================= ・このメールマガジンは、講読をお申し込みいただいた方に、無償で送信して おります。 ・このメールマガジンは、インターネットの本屋さん『まぐまぐ』 を利用して 発行しています。http://www.mag2.com/ (マガジンID: 0000083458) ◆登録変更・講読停止 ----- http://jaet.gr.jp/mag/ ◆漢情研入会申し込み ----- http://jaet.gr.jp/guiding.html ====================================================================== ┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ 漢字文献情報処理研究会メールマガジン 第十二号 [2002.7.1] ┃ ┃ 毎月1日・15日発行 ┃ ┠─────────────────────────────────┨ ┃ 編集・発行:(c)漢字文献情報処理研究会┃ ┃ 本号編集担当:二階堂善弘┃ ┠─────────────────────────────────┨ ┃本メールマガジンの内容を、著作権法に定められた範囲を超えて、無断で┃ ┃引用・転載・再利用することを厳禁します。 ┃ ┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛ |