紙の本
ユニコードの成功も世界平和のひとつのステップ:各国文化の尊重に先にある世界標準化に向けた奮闘記
2011/08/02 15:34
7人中、6人の方がこのレビューが役に立ったと投票しています。
投稿者:rindajones - この投稿者のレビュー一覧を見る
「ユニコードって何?」という人も多いことでしょう。情報通信に携わっていない人は仕方がないとしても、携わっている人もユニコードについて正確に詳しく語れる人は多くはないでしょう。私は語れません(笑)
私がこの仕事を始めた頃、インターネットはまだ商業利用前、所謂「パソコン通信」の時代(私は仕事以外では「パソコン通信」はしていなかった)。そんな時代での開発経験、更にUnix機での開発を経てきた私は、半角カナ文字と「丸で囲まれた数字」を電子メールやWebに見つけると、未だに「ドキッ」とします。完全に職業病です。
そして文字化け(到底日本語とは思えな文字が表示されたり、「・」や「?」などが羅列された状態、作ったシステムでこれが出るとかなり泣けてきます...)。UnixとゲイツOSとの整合性が面倒なのは日常茶飯事で、コンピュータにおける「外字」という存在を意識できないユーザとのトラブル、まぁ普通に頻繁に起っておりました。同僚のエンジニアと「あぁ、英語圏(ASCIIキャラクターだけで完結できる)の開発者は楽だろうなぁ」とボヤイたものでした(実際は英語圏でも多少の問題は抱えていたでしょうが、日本のそれとは比べ物にならないと思います)。
Unicode (ユニコード) とは、世界中の多くのコンピュータ上の文字列を一貫した方法で符号化し、表現し、扱うためのコンピュータ業界の標準である。
Wikipedia より
Unicodeの存在を知った時は素直に喜びました。けれども、10年程前は今ほど楽ではなかった(今でもUnicodeで問題の全てが解決した訳ではない)。Unicodeの詳細な技術本を買って一週間懸命に読んだが、(深く理解できなかったためか)実務にそれほど役にはたたなかった(泣)。
その頃は、本書でもあるような「日本人によるUnicodeの日本語文字定義の批判」が囁かれた頃だったと思う。私は批判する程には、Unicodeのこともその批判の核心も理解できていなかったのですが...。
本書は技術的な意味でのUnicodeの解説書ではありません。タイトルのように、Unicodeに関するコンソーシアムなどに関わった著者の15年余りの記録で、「戦記」というタイトルは大げさではありません。本書のサブタイトルは「文字符号の国際標準化バトル」です。彼(ら)は本当に戦っていたのです。
文字コード。ここでのこの言葉の定義を「コンピュータ上で一意なビット列が示す文字、例えば、英語の"a"、日本語の「あ」など」とします。このコードを定義する仕組み(文字の集合)のことを「文字符号化方式」、あるいはこれも「文字コード」と呼ばれる(「文字コード」を個々の文字と見るか、集合的に見るかの違い)。この「文字コード」が世の中に一つではないのが、先ほどの「半角カナ文字病」の最大の原因です。
「何故に一つではないのか?」という非難は、後だしジャンケン的に卑怯な疑問で、過去の歴史から致し方が無かった事情があります(世の中、技術的な仕様が最初からたった一つで発展したものなど少ないことでしょう)。
本書を読んで、想像以上に文字コード定義の大変さが、よりリアルに捉えることができました。コード化する文字拾い上げる際、話す言葉をメインにして大抵の文字は網羅できそうですが、書かれた文字を考慮すると一気に複雑さが増します。過去の文学作品にある常用漢字ではない文字だけでなく、人名に用いられる同音同義異形(?)の多彩さは容易に想像可能(「高」と「はしごだか」など)。
特に人名など、言語学的というよりも感情論でその文字の存在意義を主張されることもあるでしょう。そして、言語の文化的価値からすれば、あらゆる文字をコード化すべしという主張も間違いではないでしょう。「そんな、大して使われない文字なんて無視してしまえ」という割り切った考えもあるでしょうが、なかなかそうはならないのが人の心理であり文化というものかもしれません。大げさには
一つの文字が無視されることは
小さな一つの文化が失われる
と言えなくもありません。
文字のコード化の重要性は、昨今のネット上の検索サービスからも分かるように、情報の検索にあります。テクニカル的には、検索サービス側で、未登録の同音同義異形語を別の文字に置換する方法も考えられますが、それでも「その文字は未登録、代用文字はこれ」とする定義が必要なのは明らかです。
日本のみならず、世界各国の言語を統一基準でコード化する世界の大変さは容易に想像がつきます。コンピュータの発展からパックス・アメリカーナの障壁も理解できます。そんな世界で戦って来た著者を初めとする日本人の奮闘には感動すら覚えます。
佐藤敬幸氏のラオスでのプレゼンテーションの言葉は心に沁みます。
「だから、大切なことは、自分たちで考えた実装方法をがむしゃらに提案するのではなく、どういうことを実現したいのかをていねいに説明することなのです。ぼくはいつでもその橋渡しをやります。」
システムエンジニアとして長年仕事をして、この大切さは骨身にしみています。大変な作業ではありますが、それを経ない結果は、往々にして大して価値のないシステムとなります。
「ヒデキは、情報通信技術を真の意味で世界化するために、パックス・アメリカーナやオリエンタリズムと戦っていたのではなかったか。それも、米国のベイエリアという情報通信技術戦争の最前線で。」
逝ってしまった著者のバディ(相棒)のヒデキ。私は本書から、自分の進みたい道へと行く勇気を貰いました。ご冥福をお祈り致します
投稿元:
レビューを見る
ユニコードという文字コードの国際規格を決定する会議でのやりとり。
いままでは新しい文字コードの規格くらいの認識だったが、JIS規格との整合性、漢字の異体字をどこまで取り込むのかなどの議論が長い間続けられた結果として今、ユニコードを使う事ができる。
言葉は文化とはよく言うが、文字も文化だからこそ、各国間で駆け引きがある。その中で日本人が活躍していた事実を知らなかった。
文章が簡潔で読みやすい。
投稿元:
レビューを見る
ユニコードの標準化に長年携わってきた著者の体験談。
文字コードの標準化には技術的な要素ももちろんあるが、それ以上に各言語の文化的な要素が関わってくるところが、文字コードならではで面白い。
投稿元:
レビューを見る
面白かった
数学の発見やプロジェクトⅩのような読み物として読めると思う
JISコードの83年改正の問題や97年改正の騒動などその時代にパソコンを触ってきたものには熱気が感じられる内容だったが、別に文字コードに興味のない人でも、海外ビジネスのドラマとしても読めると思う
私は海外ビジネスには縁はないが、業務改善にかかわり社内の異なる利害を持つ部門の調整を行ってきた体験から、引用した文章は心にしみた
投稿元:
レビューを見る
読み終わって、結果として読んでよかったと持った面白い本だったけど、途中までつらかった。
・工業規格としての文字コードの難しさ
・文字の本質的な難しさ
・国際標準化の難しさ
・国際標準化の舞台で日本人が立ちまわることのむずかしさ
重なり合いつつもい層の違うこれらのアポリアが、時系列の中に出たり入ったりする。さらに略語と、しかもそれを縦書きで。
あるていど状況が分かってきてからは、一つ一つが興味深くなるけど、そこまではなにがなんやらわからん、というところだった。
せめて最初に、文字コードと国際会議に関するブリーフィング的な1章がほしかったな。
投稿元:
レビューを見る
普段意識することはないが、よく考えてみたら文字のコードというのは重要で、これが統一されてないと書き手の意思が正確に伝わらない。
しかし、世界には本当にたくさんの文字があり、さらに単なる書き間違いなのか意味があるのかはっきりしないものも多い。たとえば森鴎外の二文字目は×鴎、品鴎、と本人による表記すらブレており、「略字でいいんじゃない」という意見もさもありなんという感じだが、ここに文化とは、、、という反対意見が出されてくると議論がなかなか収束しなくなる。渡辺、の辺の字だけでもベラボウな数があるのだが、これもそれぞれ当事者には思い入れがあるし、、、ということで16ビットではとうていおさまらない中、各国の利害を調整していく様は読み応えがあるかも。
ただ、内容的には備忘録みたいな感じでほとんど技術的な説明がなく、門外漢にはちょっとつらい。面白い話題だけに残念。
投稿元:
レビューを見る
ものすごく面白い。国際技術標準もしくは文字コードについて少しでも興味があるなら、必読。なのだが、「少しでも興味」をあらかじめある程度持っていないと、一読しただけではよくわからないと思う。
「ISO/IEC JTC1」「ルビタグ」「Variable Selector」って言われて、ハイハイと読み進められる人には間違いなく面白いですが、そうでなければ、とりあえず付録1読んでから読んだ方がいいかもしれません。
という難点はありますが、この分野での国際技術標準を決める現場のリアリティは素晴らしく、この面倒くさいテーマの内容を「読ませる文章」で書ける筆者の力量はさすがです。
樋浦さんのご冥福をお祈りいたします。
投稿元:
レビューを見る
(推薦者コメント)
Unicodeに採用する文字、字体を決めていくなかでの日本人のいわば“戦い”の記録。ことに日本(や中国)には漢字があり、異体字も多くある。森おう外の「おう」の字などは、よく知られた問題字だろう。文字表記の世界標準を決めるのはやはり大変なのだと思い知らされる。
投稿元:
レビューを見る
コンピュータで表示されない文字。
漢字には異体字、誤字、旧字などと呼ばれる「ちょっと変わった字形の漢字」が存在します。
戸籍の仕事をした時に、人それぞれ「漢字」に対する思い入れが強いことを思い知らされました。
UNICODEが一般に知られるようになって、そう長いことたっていません。
私などは「おぉ、便利になったなぁ」くらいにしか思っていなかったのですが、やはりこういった「標準化」という作業はそれぞれの思惑が入り交じる訳で、「国際標準化」を示す作業と言うのは本当に大変なことだと感じさせられました。
著者は小学館で「ドラえもん」などの担当編集者でキャリアをスタートさせ、「一太郎」「ATOK」で有名なジャストシステムに転職、気がつくとユニコードの戦いの場に参戦していたような方。
一つ一つのエピソードが門外漢にとっても分かり安く読み物として作られており、興味深いエピソードばかりでした。
投稿元:
レビューを見る
興味ある内容でおもしろかった。
まぁユニコードの話というよりは、その策定する人々の話でした。
参考図書である、「文字符号の歴史」を読んでみようと思った。
投稿元:
レビューを見る
国際標準化におけるお話をもとにした読み物。
標準化の実態と、必要となる英語のスキルをどう会得していったか、などなど。
なお、ユニコードの技術的な面に関する話はほとんどない。
投稿元:
レビューを見る
文字符号の国際標準にまつわる様々な経緯が筆者の経験を基に描かれていて、文字符号についての理解をより深めることができる。また、グローバルな立場での標準化活動の意義や困難さについても書かれており、非常に感慨深い思いがした。
投稿元:
レビューを見る
現在の私の能力では、読解が非常に困難です。出直すことにしました。
文字関連の用語と考え方を知っているという前提でお話は進みます。ガリア戦記は存じませんでした。初めて戦記のようなものを読みました。難しい言葉と言い回し、そして長い文章で書かれていると感じてしまいました。しかし、付録は比較的簡単な文にしてくださっています。
難しいと感じてしまった原因は、戦記風と推測している書き方なのか、見慣れない用語なのかは判断できません。両方のような気もします。
借り物なので、持ち主に一度返却します。
投稿元:
レビューを見る
文字符号、とくにユニコードがどのようにしてつくられてきたのかを、
当事者自身が、当時の資料や議事録などをもとに振り返りながら、
世界的なバトルの様子に焦点をあてて時間軸に沿って書きつづった読み物。
世界の文字符号であるユニコードと
日本やアジアの文字符号との整合性をとっていく過程などを赤裸々に告白。
日本人にとって苦手な英語を著者はどうやって習得していったか、
その過程を詳しく述べることによって、英語を学ぼうとしている人たちに方向性を示唆。
国際標準化バトルの世界で本当に必要なこととは何かを教えてくれる一冊。
コンピュータで表示されない文字。
漢字には異体字、誤字、旧字などと呼ばれる「ちょっと変わった字形の漢字」が存在します。
UNICODEが一般に知られるようになって、そう長いことたっていません。
やはりこういった「標準化」という作業はそれぞれの思惑が入り交じる訳で、
「国際標準化」を示す作業と言うのは本当に大変なことだと感じさせられました。
小学館で「ドラえもん」の担当編集者だった著者は、
40代にしてATOKを有するジャストシステムに転職。
それからユニコードの国際会議に参画し、やがて国際符号化文字集合の責任者になってゆく。
本書で印象的だったのは、
ユニコードが少数民族の文字まで扱おうとする一方で、
その議論に参画するには英会話能力が必須だということ。
著者はこれについて、
「経済や産業発展のためには、国際標準(まさにグロスタ!)に則った産業基盤の育成が欠かせないわけだが、それはある種の諸刃の剣で、先進工業国がつくった枠組みを盲目的に受け入れる以外に、グローバル化した社会の中での経済や産業の発展はありえないという矛盾がある」(183ページ)と語る。
また、ほとんど海外へ行ったことがない著者が、
40代で一念発起して英会話能力を磨く姿には頭が下がる。
ただし、「大切なのは、英語のスキルではなく、伝えるべきメッセージをはっきりと持っているか否か」(33ページ)と釘を刺している。
欧米との仕事意識の違いについても言及している。
「とくに欧米人が日本人に対してよく抱く疑問は、権限を委譲されているならば、なぜその場で自分で判断しないのかということ。持ち帰って検討するなら、子供の使いと同じではないか」(60ページ)などがそれだ。
ユニコードは、あくまで表記文字を標準化するもので、
会話言語を扱うものではないということにも留意すべきだ。
ユニコードでは、シフトJISで扱えなかったような漢字まで扱えるが、方言は考慮されていない。
本書の後半で、
異体字や東南アジアの少数民族の表記文字に関する話題が登場する。
少数民族の表記文字を先進国が標準化していいものなのだろうかという著者の疑問は、
大手システムベンダ/SIがBtoCシステムを開発するときにも同じことが言える。
日本の汎用コンピュータは、
名前に使われる異体字(渡辺の「辺」や斉藤の「斉」など)を表記するために
各社固有の文字コードを使っているが、
これをオープン化/Web化する際にシフトJISやEUC-JPにすると、異体字が完全に無視される。
異体字の名を持つ人の中には、
それにこだわりを持っている人が少なからずおり、
こうしたシステム変更に対してクレームをつけてくる。
著者は「システムの設計は、一般にユーザーの存在と要求を前提として行われる。われわれ、システムを提供する側には、ユーザーの要求に応える義務がある」(97ページ)と指摘するが、
「しかしまた、潜在的なものも含めて、あらゆるニーズを満たすシステムも、これまた、一般的には存在しない」とも言っている。
システム開発の匙加減が難しいのは、こうした背景があるからだ。
私の経験でも、システム設計で文字コードが議論になることが多い。
設計段階で文字コードが決まってしまうと、あとで変更するのはまず不可能だからだ。
判断が厳しいのは、せっかくフロントエンド系にユニコードを導入して異体字が扱えるようにしても、
宛名を印字するバックエンド系が汎用コンピュータだったり、
(本書でも解説されている)「16ビット固定長ユニコード」という誤った設計のフレームワークが採用されている場合である。
さらに、すべてをユニコードで実装しても、
エンドユーザーが使用しているフォントが対応していない場合もあり得る。
投稿元:
レビューを見る
当時自分はunicode自体にかなり嫌悪感を持っていた。
jis skis メインフレームのコード、この上unicodeなんて作るなよぉ〜、中国語、台湾、日本語の漢字を一緒くたにするなよ〜、などとブツブツ言いまくっていた。
その当時、このコードの策定が、どのように進められていたのか、面白おかしく読ませていただきました。
幕間の英語の勉強、会議での駆け引きについても興味深く読ませていただきました。