言語間デジタル・ディバイド
"Digital Divide"
among Languages
三上 喜貴
Yoshiki Mikami
Key Words: Language, Digital-Divide, Information Technology
米国情報通信庁(NTIA: National Telecommunication and Information Administration)は、米国民の情報アクセス状況に関する大規模な実態調査を行い、所得階層等の異なる集団間に情報アクセス能力の大きな開きがあることを認め、この情報アクセス格差を「デジタル・ディバイド」(デジタル世界における分水嶺、あるいは情報アクセス格差)と呼んだ。そして数次にわたるレポートを通じて、この格差を如何にして縮めるかが21世紀の情報化政策の基本的課題であると論じた[i]。
しかし地球規模でみるとき、より深刻なデジタル・ディバイドが地域間、国家間に存在する。西暦2000年を迎えた今日、世界の人口は60億人を超えたと推計されているが、この世界人口を、その所属する国家の平均一人あたり所得水準で10段階に分解し、固定回線電話、移動体電話及びインターネットに関するアクセスの現状を図示したものがFig.1である。
出典:International Telecommunication Union, ITU Statistical Yearbook 1999 URL http://www.itu.org
世界人口60億人のうち、Fig.1中で最高位の所得階層(約2万ドル以上)に属するのは6.8億人であり、それは全体の12%に満たない。しかしながら、この12%の人口が世界全体の45%に相当する固定電話回線へのアクセスを持ち、移動体電話では52%のシェアを占める。更にインターネットへのアクセスという指標で見ると、このグループが世界全体のインターネットユーザー2億4000万人の73%を占めると推計されている。
一方、所得階層別の人口分布からみれば、世界人口の60%以上は一人あたり所得が1000ドル以下の人口からなる。中国の1999年における平均所得水準は約800ドル、インドのそれは450ドルというレベルにあり、この両国の人口だけでも世界人口の4割近くを占める。この他にも、合計70カ国がこの所得水準に属する。
三つのコミュニケーション媒体へのアクセス状況を対人口比で比較するならばFig.2のようになる。人口1000人比でみたアクセス比率は、所得最上位階層のグループと1000ドル以下のグループとの間で二桁近い格差が存在する。実際には、ひとつの国家の中でも大きな所得水準格差が存在するから、厳密な所得水準別でみた情報アクセス格差は更に著しいものであろう。
こうした中で、本稿が論ずるのは、所得階層間の格差の背景にある言語・使用文字間の格差の問題である。後述するように、英語を第一言語ないし第二言語とする人口は世界中で5億人から7億人と推計されており、それは世界人口の約1割に過ぎないが、インターネット利用人口の6割は英語を母国語とする人口であり 、「E−コマースとはイングリッシュ・コマースのことである」といった冗談まで現れている。Fig.1、Fig.2に見られた所得間格差と重なるようにして、そこには言語間格差とも言うべき格差が存在しているのである。
社会において生産され、流通する情報の多くは言語によって表現された情報であり、とりわけ国語をもって表記された言語情報である。新聞、雑誌、書籍出版、報道、映画、音楽など、言語によるコミュニケーションを直接の目的とする分野はいうまでもなく、言語によるコミュニケーションを直接の目的としない情報システムの多くも実は言語による情報表現を必須の要件としている。母国語を不自由なくとり扱えることは情報技術が社会に定着するための必須要件である。日本における情報化の歩みを振り返っても、ワープロの登場(1978年)による簡便な日本語処理の実現が情報処理技術大衆化の画期をなしていた。マルチメディア技術が発達し、大量の映像情報が国境を越える現代にあってもこの事情に変わりはない。
しかし、音声の形態で流通する言語情報はそれが何語であれ、技術上の区別はない。海底通信ケーブルやテレビ放送電波はそれが運ぶ会話がどのような言語であるかを区別しない。何語の会話であってもそれは波長や振幅という単一の物理的現象に還元される。実際、既に多数の多言語放送局がインターネット上で開局している。インドのオール・インディア・ラジオ局(AIR)はヒンディ語をはじめとする多言語放送をインターネット上で開始しており、マレーシアのラジオ・テレビ・マレーシア局(RTM)はマレー語、中国語、タミル語、英語の四言語でインターネット放送を行っている。しかしこれらの多言語放送は、送り出す側も聞く側も、言語に応じた技術上の特段の手当てをする必要はない。この点では、音声電話も同様であり、固定電話であれ、移動体電話であれ、言語に応じたローカライゼーションの問題は原則として存在しない(電話番号のメモリー機能などは除く)。
これに対して文字で表現される言語情報の場合には少し事情が異なる。このことは活字印刷の歴史を振り返れば明らかである。活字印刷においては言語に応じた一揃いの活字の鋳造という準備を必要とする。これは活字印刷における「ローカライゼーション」ということができる。活字印刷技術は中国とヨーロッパで前後して発明されたが、その後もっぱらヨーロッパで発展を遂げ、アジアでは結局彫版印刷だけが生き残った。宣教師達によってもたらされた活字印刷術がアジアの文字を鋳造した活字によって行われるようになったのは19世紀のことであり、日本で活字印刷が始まったのは開国以降のことである。印刷技術のアジアへのローカライゼーションの過程は300年余りの歳月を要したわけである。そして、タイプライターや印刷電信装置もまた活字印刷と同様のローカライゼーションを必要とした。
現代の情報技術も、それが文字で表現される情報を扱う限りにおいてこのようなローカライゼーションを必要とするのであるが、では先に確認した世界規模の情報格差の背後に、個々の言語及び文字へのローカライゼーションの進展の相違に由来する格差は認められるのか。本稿では、これをインターネットへのアクセス及び印刷・出版などの活字文化へのアクセスという観点から分析してみたい。
今日、英語を母語とする人口は3.2〜3.8億人、英語を第二言語とする人口は1.5〜3億人と推計されている[ii]。両者の上限値を合計してもそれは世界人口の約1割に過ぎない。にもかかわらず、現時点では世界のインターネット利用者の半分以上は英語を母国語とする利用者が占めている。
例えばユーロマーケッティング社は言語別に見た世界のインターネット利用者人口(以下、オンライン人口と呼ぶ)をTable 1のように推計している。1999年頃の推計値として、全世界に2.2億人のオンライン人口があり、このうち英語を母国語とするものが1.33億人、英語以外を母語とするものが1.0億人と推計している。英語人口には英、米、加[iii]、豪、アイルランド、南アフリカ、ニュージーランドの各英語人口のほか、インドの150万人、フィリピンの100万人が加えられている。英語のオンライン人口と非英語のオンライン人口とは約1200万人の重複カウント分を含むが、これは職場で英語を、家庭では英語以外の母語でという多言語利用者を二重計上しているためである。
一方、非英語人口のうちアジアの言語を母語とするオンライン人口は3640万人、全オンライン人口の15.4%であり、言語別には日本語1970万人、中国語990万人、韓国語430万人、アラビア語95万人、マレー語70万人、タイ語10万となっている。これは基本的には各国におけるインターネット利用者数推計値をベースとしているが、米国在住アジア人を考慮した加算が行われている。例えば中国語のオンライン人口990万人は、中国大陸におけるインターネット利用者400万人、香港85万人、台湾400万人、シンガポール50万人に在米中国人のインターネット利用者数推計値52万人を加えて得られたものである。日本語、韓国語のオンライン人口にも同様にして在米人口の加算が行われている。
Table 1 言語別オンライン人口推計値(百万人)
言語 |
話者数(A) |
構成比(%) |
オンライン人口(B) |
B/A(%) |
||
世界合計 |
6,000 |
100 |
221 |
3.7% |
||
英語 |
322 |
6 |
133 |
41.3% |
||
英語以外 |
5,630 |
94 |
100 |
1.8% |
||
|
ヨーロッパ言語 |
1,089 |
18 |
67.6 |
6.2% |
|
|
アジアの言語 |
■ |
■ |
36.4 |
|
|
|
|
アラビア語 |
130 |
2.2 |
0.95 |
0.7% |
|
|
中国語 |
885 |
14.8 |
9.9 |
1.1% |
|
|
ヘブライ語 |
6 |
0.1 |
0.8 |
13.3% |
|
|
日本語 |
125 |
2.1 |
19.7 |
15.8% |
|
|
韓国語 |
75 |
1.3 |
4.3 |
5.7% |
|
|
マレー語 |
18 |
0.3 |
0.7 |
3.9% |
|
|
タイ語 |
20 |
0.3 |
0.1 |
0.5% |
出典:Euromarketing URL http://www.euromktg.com/globstats/ 但しアジアの言語の話者数は筆者の推計。
オンライン・マーケッティングをビジネスとする調査会社のデータだけに、絶対数において一定規模のインターネットユーザーを有する言語についてのみの調査となっており、また、これだけの比較では格差がどのような要因によるものか判別がつかない。
そこで、ITU統計を利用してインターネットユーザー密度を文字圏別に集計を行った。「文字圏」という区分は判定が難しいが、概ね、欧州及び南北アメリカ大陸、オセアニア地域はラテン文字圏であり、アフリカ大陸のサハラ以北はアラビア文字圏で以南はラテン文字圏、アジアはインドネシア、フィリピン、マレーシア、シンガポールなど幾つかの例外を除き、漢字圏、インド系文字圏およびアラビア文字圏からなる。また、旧ソ連邦及び東欧の幾つかの国はキリル文字圏である。こうした文字圏による分類を、ITU統計収録の200カ国余に関して行い、更に所得水準による影響を同一条件下で比較するために、所得階層別比較を行った結果がTable 2(利用者数)及びFig.3(同密度)である。
Table 2 所得水準別、文字圏別のインターネット利用者数(百万人)
Per capita GDP (US$) |
Latin + extension |
Arabic + Hebrew |
Cyril + |
Indian |
Hanzi + |
Others |
Non-Latin |
Total |
NA |
0.016 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.016 |
46< |
0.004 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.004 |
100< |
0.008 |
0.001 |
0.000 |
0.035 |
0.000 |
0.006 |
0.042 |
0.049 |
215< |
0.461 |
0.086 |
0.017 |
0.502 |
0.000 |
0.004 |
0.608 |
1.069 |
464< |
0.343 |
0.002 |
0.171 |
0.020 |
8.900 |
0.005 |
9.098 |
9.441 |
1,000< |
0.379 |
0.213 |
2.900 |
0.200 |
0.000 |
0.000 |
3.313 |
3.692 |
2,154< |
10.119 |
0.210 |
0.000 |
0.000 |
0.000 |
0.000 |
0.210 |
10.329 |
4,642< |
7.038 |
0.060 |
0.000 |
0.000 |
3.103 |
0.000 |
3.163 |
10.201 |
10,000< |
25.192 |
0.730 |
0.780 |
0.000 |
3.011 |
0.000 |
4.521 |
29.713 |
21,544< |
161.548 |
0.000 |
0.000 |
0.000 |
17.740 |
0.000 |
17.740 |
179.288 |
total |
205.106 |
1.301 |
3.867 |
0.757 |
32.754 |
0.015 |
38.694
|
243.800 |
% |
84.129 |
0.534 |
1.586 |
0.310 |
13.435 |
0.006 |
15.871
|
100.000 |
注:Othersとは、アルメニア文字、グルジア文字、アムハリック文字(エチオピア)などである。
出典:前掲、ITU Statistical Yearbook 1999
Table 2の結果は、使用文字を基準として考えたとき、アクセス格差が一層顕著なラテン文字利用者への集中としてあらわれることを示している。即ち、オンライン人口約二億人のうち、ラテン文字圏の利用者が84%を占め、13.4%を漢字文化圏が、1.6%をキリル・ギリシャ文字文化圏が、そして、0.5%をアラビア・ヘブライ文字圏、0.3%をインド系文字圏が占めるという具合である。ここでも、もちろん所得水準による格差は著しい。2億人のオンライン人口の73%は最上位の所得階層、つまり一人あたりGDPが一万ドルを超える国や地域での利用者が占めるが、この数字を上回る集中が、ラテン文字への集中として現れているのである。
出典:前掲、ITU Statistical Yearbook 1999より、筆者推計。
利用者密度を示すFig.3からは、所得水準を同一条件下で比較した場合の文字圏間格差の存在を読取ることを期待したのであるが、この結果から断定的な結論を得ることは難しい。但し、幾つかの傾向をみてとることができよう。以下、文字圏別に観察できる傾向をまとめておこう。
第一に漢字圏については、ラテン文字圏との比較において文字に起因する格差は認められそうもない。所得が上位の漢字圏地域は日本、韓国、台湾、香港等であるが、最上位階層でラテン文字圏よりも低い値となっているのは主として日本におけるユーザー密度が相対的に低いためであり、また、孤立した「点」として表されている中国のユーザー密度は同所得水準のラテン文字圏よりもむしろ高い結果となっている。こうした状況は、漢字圏におけるローカライゼーションが比較的早い時期から進行したこと、また、人口大国中国の都市部では既に所得水準が数1000ドルに達している膨大な人口層があり、これを全国平均所得で比較することにともなう見かけ上の誤差といった要因によって説明されるかもしれない。
第二にアラビア文字圏は、平均所得水準の比較的高い湾岸産油国と、アフリカ北部の非産油国とで少し開きがあるが、全体としてユーザー密度は低い。しかし、その背景にはイスラム圏におけるインターネット利用規制といった政治的、社会的、制度的な条件が大きな理由となっているかもしれない。
第三にキリル文字圏は同所得水準のラテン文字圏と比較する限りむしろ利用者密度が高いとすら言えそうである。キリル文字あるいはギリシャ文字はともに文字集合の大きさ、性質においてラテン文字と大きな差はなく、ローカライゼーションも比較的早くから行われたことから、この結果は理解できるところである。
最後にインド系文字圏であるが、これは全体として同所得水準の他文字圏よりも利用者密度が低いという結果を示している。なお100〜215ドル水準でラテン文字圏を上回っているのはネパール(人口約2000万人)の利用者数密度が比較的高いためである。ここでインド系文字として分類した文字群は、インドの公用語で使用されるベンガル、タミル、マラヤラム、グジャラティ等9種類の文字のほか、シンハラ文字(スリランカ)、タイ文字、ミャンマー文字、クメール文字(カンボジア)、ラオ文字(ラオス)等である。インド系文字圏は、情報技術のローカライゼーションと言う点で最も後発の文字圏であり、情報交換の基礎である文字符号化方式についても、いまだ多くの地域で全国的な規模での互換性を欠いた状態にある。
ここで注意する必要があるのは、現在の各種インターネット利用者数推計値が与えているのはあくまでも利用者の所在国を基準にした数値であり、利用者が実際にどのような言語あるいは文字を利用しているかは調査されていないということである。日本の場合には、英語だけでインターネットを利用している人口はごく限られたものであると考えられるが、先のユーロマーケッティング社の推計にも考慮されているとおり、例えばインドにおける利用者の多くは英語だけを用いてインターネットを使用しているというケースも少なくない。利用者密度がわずか数万人に一人というレベルにある地域においては、利用者の裾野が限られたものであるだけに、こうしたバイアスが常に存在することを念頭におかなくてはならない。こうした点を考慮するならば、ラテン文字への集中の実態は先の84%という数字すらなお大幅な過小評価となっていると考えるべきであろう。より正確な実態把握のためには、利用言語、利用文字集合まで立ち入った調査が必要である。
出典:UNESCO Yearbook 1999
[i] 米国商務省のNational Telecommunications and Information Administrationは、1995年以降、"Falling Through the Net"シリーズとして以下の三つの報告書をまとめている。(1) A Survey of the "Have Nots" in Rural and Urban America (1995)、(2) New Data on the Digital Divide (1998)、(3) Defining the Digital Divide (July 1999).
[ii] Crystal, David. 1997. English as a global language. Cambridge University Press.54頁。
[iii] カナダについては英語州の人口比78%を用いて補正している。