言語間デジタル・ディバイド

"Digital Divide" among Languages

 

三上 喜貴

Yoshiki Mikami

 

Key Words: Language, Digital-Divide, Information Technology

 

1. 地球規模の「デジタル・ディバイド」

米国情報通信庁(NTIA: National Telecommunication and Information Administration)は、米国民の情報アクセス状況に関する大規模な実態調査を行い、所得階層等の異なる集団間に情報アクセス能力の大きな開きがあることを認め、この情報アクセス格差を「デジタル・ディバイド」(デジタル世界における分水嶺、あるいは情報アクセス格差)と呼んだ。そして数次にわたるレポートを通じて、この格差を如何にして縮めるかが21世紀の情報化政策の基本的課題であると論じた[i]

しかし地球規模でみるとき、より深刻なデジタル・ディバイドが地域間、国家間に存在する。西暦2000年を迎えた今日、世界の人口は60億人を超えたと推計されているが、この世界人口を、その所属する国家の平均一人あたり所得水準で10段階に分解し、固定回線電話、移動体電話及びインターネットに関するアクセスの現状を図示したものがFig.1である。

 

出典:International Telecommunication Union, ITU Statistical Yearbook 1999 URL http://www.itu.org

 

 

世界人口60億人のうち、Fig.1中で最高位の所得階層(約2万ドル以上)に属するのは6.8億人であり、それは全体の12%に満たない。しかしながら、この12%の人口が世界全体の45%に相当する固定電話回線へのアクセスを持ち、移動体電話では52%のシェアを占める。更にインターネットへのアクセスという指標で見ると、このグループが世界全体のインターネットユーザー24000万人の73%を占めると推計されている。

一方、所得階層別の人口分布からみれば、世界人口の60%以上は一人あたり所得が1000ドル以下の人口からなる。中国の1999年における平均所得水準は約800ドル、インドのそれは450ドルというレベルにあり、この両国の人口だけでも世界人口の4割近くを占める。この他にも、合計70カ国がこの所得水準に属する。

三つのコミュニケーション媒体へのアクセス状況を対人口比で比較するならばFig.2のようになる。人口1000人比でみたアクセス比率は、所得最上位階層のグループと1000ドル以下のグループとの間で二桁近い格差が存在する。実際には、ひとつの国家の中でも大きな所得水準格差が存在するから、厳密な所得水準別でみた情報アクセス格差は更に著しいものであろう。

 

出典:同前

 

こうした中で、本稿が論ずるのは、所得階層間の格差の背景にある言語・使用文字間の格差の問題である。後述するように、英語を第一言語ないし第二言語とする人口は世界中で5億人から7億人と推計されており、それは世界人口の約1割に過ぎないが、インターネット利用人口の6割は英語を母国語とする人口であり 、「E−コマースとはイングリッシュ・コマースのことである」といった冗談まで現れている。Fig.1Fig.2に見られた所得間格差と重なるようにして、そこには言語間格差とも言うべき格差が存在しているのである。

 

2. 情報技術と言語

社会において生産され、流通する情報の多くは言語によって表現された情報であり、とりわけ国語をもって表記された言語情報である。新聞、雑誌、書籍出版、報道、映画、音楽など、言語によるコミュニケーションを直接の目的とする分野はいうまでもなく、言語によるコミュニケーションを直接の目的としない情報システムの多くも実は言語による情報表現を必須の要件としている。母国語を不自由なくとり扱えることは情報技術が社会に定着するための必須要件である。日本における情報化の歩みを振り返っても、ワープロの登場(1978年)による簡便な日本語処理の実現が情報処理技術大衆化の画期をなしていた。マルチメディア技術が発達し、大量の映像情報が国境を越える現代にあってもこの事情に変わりはない。

しかし、音声の形態で流通する言語情報はそれが何語であれ、技術上の区別はない。海底通信ケーブルやテレビ放送電波はそれが運ぶ会話がどのような言語であるかを区別しない。何語の会話であってもそれは波長や振幅という単一の物理的現象に還元される。実際、既に多数の多言語放送局がインターネット上で開局している。インドのオール・インディア・ラジオ局(AIR)はヒンディ語をはじめとする多言語放送をインターネット上で開始しており、マレーシアのラジオ・テレビ・マレーシア局(RTM)はマレー語、中国語、タミル語、英語の四言語でインターネット放送を行っている。しかしこれらの多言語放送は、送り出す側も聞く側も、言語に応じた技術上の特段の手当てをする必要はない。この点では、音声電話も同様であり、固定電話であれ、移動体電話であれ、言語に応じたローカライゼーションの問題は原則として存在しない(電話番号のメモリー機能などは除く)。

これに対して文字で表現される言語情報の場合には少し事情が異なる。このことは活字印刷の歴史を振り返れば明らかである。活字印刷においては言語に応じた一揃いの活字の鋳造という準備を必要とする。これは活字印刷における「ローカライゼーション」ということができる。活字印刷技術は中国とヨーロッパで前後して発明されたが、その後もっぱらヨーロッパで発展を遂げ、アジアでは結局彫版印刷だけが生き残った。宣教師達によってもたらされた活字印刷術がアジアの文字を鋳造した活字によって行われるようになったのは19世紀のことであり、日本で活字印刷が始まったのは開国以降のことである。印刷技術のアジアへのローカライゼーションの過程は300年余りの歳月を要したわけである。そして、タイプライターや印刷電信装置もまた活字印刷と同様のローカライゼーションを必要とした。

現代の情報技術も、それが文字で表現される情報を扱う限りにおいてこのようなローカライゼーションを必要とするのであるが、では先に確認した世界規模の情報格差の背後に、個々の言語及び文字へのローカライゼーションの進展の相違に由来する格差は認められるのか。本稿では、これをインターネットへのアクセス及び印刷・出版などの活字文化へのアクセスという観点から分析してみたい。

 

3. 非英語オンライン人口

今日、英語を母語とする人口は3.23.8億人、英語を第二言語とする人口は1.53億人と推計されている[ii]。両者の上限値を合計してもそれは世界人口の約1割に過ぎない。にもかかわらず、現時点では世界のインターネット利用者の半分以上は英語を母国語とする利用者が占めている。

例えばユーロマーケッティング社は言語別に見た世界のインターネット利用者人口(以下、オンライン人口と呼ぶ)をTable 1のように推計している。1999年頃の推計値として、全世界に2.2億人のオンライン人口があり、このうち英語を母国語とするものが1.33億人、英語以外を母語とするものが1.0億人と推計している。英語人口には英、米、加[iii]、豪、アイルランド、南アフリカ、ニュージーランドの各英語人口のほか、インドの150万人、フィリピンの100万人が加えられている。英語のオンライン人口と非英語のオンライン人口とは約1200万人の重複カウント分を含むが、これは職場で英語を、家庭では英語以外の母語でという多言語利用者を二重計上しているためである。

一方、非英語人口のうちアジアの言語を母語とするオンライン人口は3640万人、全オンライン人口の15.4%であり、言語別には日本語1970万人、中国語990万人、韓国語430万人、アラビア語95万人、マレー語70万人、タイ語10万となっている。これは基本的には各国におけるインターネット利用者数推計値をベースとしているが、米国在住アジア人を考慮した加算が行われている。例えば中国語のオンライン人口990万人は、中国大陸におけるインターネット利用者400万人、香港85万人、台湾400万人、シンガポール50万人に在米中国人のインターネット利用者数推計値52万人を加えて得られたものである。日本語、韓国語のオンライン人口にも同様にして在米人口の加算が行われている。

 

Table 1 言語別オンライン人口推計値(百万人)

言語

話者数(A)

構成比()

オンライン人口(B)

B/A()

世界合計

6,000

100

221

3.7%

英語

322

6

133

41.3%

英語以外

5,630

94

100

1.8%

 

ヨーロッパ言語

1,089

18

67.6

6.2%

 

アジアの言語

36.4

 

 

 

アラビア語

130

2.2

0.95

0.7%

 

 

中国語

885

14.8

9.9

1.1%

 

 

ヘブライ語

6

0.1

0.8

13.3%

 

 

日本語

125

2.1

19.7

15.8%

 

 

韓国語

75

1.3

4.3

5.7%

 

 

マレー語

18

0.3

0.7

3.9%

 

 

タイ語

20

0.3

0.1

0.5%

出典:Euromarketing URL http://www.euromktg.com/globstats/ 但しアジアの言語の話者数は筆者の推計。

オンライン・マーケッティングをビジネスとする調査会社のデータだけに、絶対数において一定規模のインターネットユーザーを有する言語についてのみの調査となっており、また、これだけの比較では格差がどのような要因によるものか判別がつかない。

そこで、ITU統計を利用してインターネットユーザー密度を文字圏別に集計を行った。「文字圏」という区分は判定が難しいが、概ね、欧州及び南北アメリカ大陸、オセアニア地域はラテン文字圏であり、アフリカ大陸のサハラ以北はアラビア文字圏で以南はラテン文字圏、アジアはインドネシア、フィリピン、マレーシア、シンガポールなど幾つかの例外を除き、漢字圏、インド系文字圏およびアラビア文字圏からなる。また、旧ソ連邦及び東欧の幾つかの国はキリル文字圏である。こうした文字圏による分類を、ITU統計収録の200カ国余に関して行い、更に所得水準による影響を同一条件下で比較するために、所得階層別比較を行った結果がTable 2(利用者数)及びFig.3(同密度)である。

 

Table 2 所得水準別、文字圏別のインターネット利用者数(百万人)

Per capita GDP (US$)

Latin + extension

Arabic + Hebrew

Cyril +
Greek

Indian

Hanzi +
Kana +
Hangul

Others

Non-Latin

Total

NA

0.016

0.000

0.000

0.000

0.000

0.000

0.000

0.016

46<

0.004

0.000

0.000

0.000

0.000

0.000

0.000

0.004

100<

0.008

0.001

0.000

0.035

0.000

0.006

0.042

0.049

215<

0.461

0.086

0.017

0.502

0.000

0.004

0.608

1.069

464<

0.343

0.002

0.171

0.020

8.900

0.005

9.098

9.441

1,000<

0.379

0.213

2.900

0.200

0.000

0.000

3.313

3.692

2,154<

10.119

0.210

0.000

0.000

0.000

0.000

0.210

10.329

4,642<

7.038

0.060

0.000

0.000

3.103

0.000

3.163

10.201

10,000<

25.192

0.730

0.780

0.000

3.011

0.000

4.521

29.713

21,544<

161.548

0.000

0.000

0.000

17.740

0.000

17.740

179.288

total

205.106

1.301

3.867

0.757

32.754

0.015

38.694

243.800

%

84.129

0.534

1.586

0.310

13.435

0.006

15.871

100.000

注:Othersとは、アルメニア文字、グルジア文字、アムハリック文字(エチオピア)などである。

出典:前掲、ITU Statistical Yearbook 1999

 

Table 2の結果は、使用文字を基準として考えたとき、アクセス格差が一層顕著なラテン文字利用者への集中としてあらわれることを示している。即ち、オンライン人口約二億人のうち、ラテン文字圏の利用者が84%を占め、13.4%を漢字文化圏が、1.6%をキリル・ギリシャ文字文化圏が、そして、0.5%をアラビア・ヘブライ文字圏、0.3%をインド系文字圏が占めるという具合である。ここでも、もちろん所得水準による格差は著しい。2億人のオンライン人口の73%は最上位の所得階層、つまり一人あたりGDPが一万ドルを超える国や地域での利用者が占めるが、この数字を上回る集中が、ラテン文字への集中として現れているのである。

出典:前掲、ITU Statistical Yearbook 1999より、筆者推計。

 

利用者密度を示すFig.3からは、所得水準を同一条件下で比較した場合の文字圏間格差の存在を読取ることを期待したのであるが、この結果から断定的な結論を得ることは難しい。但し、幾つかの傾向をみてとることができよう。以下、文字圏別に観察できる傾向をまとめておこう。

第一に漢字圏については、ラテン文字圏との比較において文字に起因する格差は認められそうもない。所得が上位の漢字圏地域は日本、韓国、台湾、香港等であるが、最上位階層でラテン文字圏よりも低い値となっているのは主として日本におけるユーザー密度が相対的に低いためであり、また、孤立した「点」として表されている中国のユーザー密度は同所得水準のラテン文字圏よりもむしろ高い結果となっている。こうした状況は、漢字圏におけるローカライゼーションが比較的早い時期から進行したこと、また、人口大国中国の都市部では既に所得水準が数1000ドルに達している膨大な人口層があり、これを全国平均所得で比較することにともなう見かけ上の誤差といった要因によって説明されるかもしれない。

第二にアラビア文字圏は、平均所得水準の比較的高い湾岸産油国と、アフリカ北部の非産油国とで少し開きがあるが、全体としてユーザー密度は低い。しかし、その背景にはイスラム圏におけるインターネット利用規制といった政治的、社会的、制度的な条件が大きな理由となっているかもしれない。

第三にキリル文字圏は同所得水準のラテン文字圏と比較する限りむしろ利用者密度が高いとすら言えそうである。キリル文字あるいはギリシャ文字はともに文字集合の大きさ、性質においてラテン文字と大きな差はなく、ローカライゼーションも比較的早くから行われたことから、この結果は理解できるところである。

最後にインド系文字圏であるが、これは全体として同所得水準の他文字圏よりも利用者密度が低いという結果を示している。なお100215ドル水準でラテン文字圏を上回っているのはネパール(人口約2000万人)の利用者数密度が比較的高いためである。ここでインド系文字として分類した文字群は、インドの公用語で使用されるベンガル、タミル、マラヤラム、グジャラティ等9種類の文字のほか、シンハラ文字(スリランカ)、タイ文字、ミャンマー文字、クメール文字(カンボジア)、ラオ文字(ラオス)等である。インド系文字圏は、情報技術のローカライゼーションと言う点で最も後発の文字圏であり、情報交換の基礎である文字符号化方式についても、いまだ多くの地域で全国的な規模での互換性を欠いた状態にある。

ここで注意する必要があるのは、現在の各種インターネット利用者数推計値が与えているのはあくまでも利用者の所在国を基準にした数値であり、利用者が実際にどのような言語あるいは文字を利用しているかは調査されていないということである。日本の場合には、英語だけでインターネットを利用している人口はごく限られたものであると考えられるが、先のユーロマーケッティング社の推計にも考慮されているとおり、例えばインドにおける利用者の多くは英語だけを用いてインターネットを使用しているというケースも少なくない。利用者密度がわずか数万人に一人というレベルにある地域においては、利用者の裾野が限られたものであるだけに、こうしたバイアスが常に存在することを念頭におかなくてはならない。こうした点を考慮するならば、ラテン文字への集中の実態は先の84%という数字すらなお大幅な過小評価となっていると考えるべきであろう。より正確な実態把握のためには、利用言語、利用文字集合まで立ち入った調査が必要である。

 

4.印刷・筆記用紙の消費量

オンライン空間における情報アクセス格差と対比する意味で、オフライン空間におけるアクセス格差についても検討してみる。「紙の消費量は文化のバロメーター」といわれる。紙は伝統的な情報の媒体であり、その消費量はオフライン空間、あるいは「活字空間」における情報アクセスの度合いを示す総合的な指標ととらえることができる。この指標に関し、各国の消費水準にはどの程度の格差があるのであろうか。UNESCO統計によれば、現在の日本では一人当りの年間用紙使用量が100sを超えている。これは包装・梱包用紙やトイレ・化粧用のティッシュ・ペーパーといった用途を除く、印刷用紙及び筆記用紙に限っての数字である(但し、新聞印刷用紙は別途調査されており、今回取り上げる指標からは除かれている)。A4版のコピー用紙1枚の重さは大体4〜5gであるから、我々日本人は一人当りA4用紙に換算して年間二万枚以上の紙を消費している勘定になる。これに対して、例えばカンボジアの一人当り用紙消費量は新聞とその他の用途を併せて年間わずか70gに満たない。A4用紙に換算すると年間15枚程度ということになる。ラオス、北朝鮮も同程度である。日本とこれらの国との間には、紙の消費量に千倍以上の開きがあることになる。Fig.4は、所得水準及び使用文字圏別に印刷筆記用紙消費量を示したものである。 

出典:UNESCO Yearbook 1999

 Fig.4Fig.1と対比すれば明らかなとおり、用紙消費量は実は固定電話や移動体電話よりも著しい所得水準間格差を示している。固定電話や移動体電話の場合、所得水準1万ドル以上の地域が世界全体に対して占める割合はそれぞれ57%、69%であるのに対して、全世界の印刷・筆記用紙の77%は所得水準1万ドル以上の地域で消費されている。文字圏別の集中度においても、やはり固定電話、移動体電話の場合よりも著しい。ラテン文字圏の占める割合は固定電話の場合で63%、移動体電話の場合で67%であるのに対して、用紙消費量のラテン文字圏への集中度は72%となっている。図からも確認できるとおり、ラテン文字に続くのは漢字圏であり、これが23%を占めるが、アラビア+ヘブライ文字圏は1.2%、キリル+ギリシャ文字圏は1.1%、インド系文字圏は2.2%と、それぞれ極めて小さな割合を占めるに過ぎない。つまり、「デジタル・ディバイド」以前の問題として、デジタルでもアナログでもない、オフラインの活字空間の段階で、情報アクセスに関する所得間格差、文字圏間格差は既に存在していたのである。こうした用紙消費量の格差は、基本的は所得水準格差によって、またある部分は出版活動に関する許可制や検閲制度の有無などによって説明されるものであるが、冒頭に述べた「ローカライゼーション」との関連で言えば、それは、多くの国で活字文化を支える技術的な基盤すら十分に開花していないということをも意味している。より具体的にいえば、国語の印刷に必要な活字セットすら安定した供給体制を欠いており、これを備えた印刷所が不足しており、そして更に活字文化を担う出版社や印刷所が経営体として社会的な定着を見ていないのである。少数民族までに視野に入れれば、活字印刷の時代を全く迎えなかった文字文化圏すらある。筆者は1999年の3月にネパールを訪ねた折、カトマンドゥーでソフトハウスを経営する専門家から、ネパールの主要民族の一つであるネワール族の使用するネワール文字はついに金属活字が作られず、印刷はすべてヒンディ語のデーヴァナーガリ文字への換字によって行われていることを教えられた。 
Fig.5
 アジア諸国の識字率と用紙消費量(1995年) 
活字文化の基礎の問題が重要であるのは、それが、これらの社会における識字率の低さの遠因ともなっているからである。Fig.5に示すように、実際、用紙消費量と識字率とは顕著な相関を示している。UNESCO United Nations Education, Science and Culture Organization)では、途上国における文盲撲滅のため、まず教育の基礎的な手段である教科書、識字用読み物、一般図書の十分な供給を図る必要があるとして、1967年に「発展途上地域における図書開発計画」を発足させた。当初は二大目標として、@年間一人あたり16頁に過ぎない教育用図書の供給量を1980年までに80頁に増加させる、A同じく一般用図書の供給量を1980年までに80頁に増加させる、ことをあげた。80頁の教科書や図書はおよそ200グラム程度の用紙を必要とするから、この二つの目標を達成するだけでも年間400グラムの用紙を必要とする。しかし、現在なお、年間の印刷・筆記用紙の消費量が400グラムを下まわる国は58ヶ国存在している。

 

5.まとめ

こうした状況を考えると、地球規模のデジタル・ディバイドが克服されて行く道のりは、デジタルな空間内だけで進められるものではなく、印刷媒体と連携しながら進展するプロセスとなろう。例えば、デジタルなコミュニケーションの「ラスト・マイル」は印刷媒体が担う、といった組み合わせである。また、あらゆるコミュニケーションの基礎である識字の問題は、デジタルなリテラシーに先立って活字媒体に対するリテラシーが十分に達成されるというプロセスを必要とするであろう。一方、情報技術の普及はグーテンベルク以降の五百年間に十分な定着を遂げなかった活字文化そのものを「活字」によらず開花させる可能性すら持っている。東南アジアの町でちょっとしたチラシや新聞の編集に用いられているのがパソコンを用いたデスクトップ・パブリッシング(DTP)である。筆者がミャンマーで調査したところではパソコンユーザの3割が出版用途であった。国語処理を行うパソコンとプリンタは最も手軽に利用できる製版機械であり、これをオフセット印刷すれば最も簡便かつ低コストの印刷所ができあがるのである。もちろん、パソコンによるDTPで全ての問題が片付くわけではない。引き続き用紙すら手に入らないという貧困が存在するし、義務教育の体制がそもそも行き渡っていないという根本的な問題もある。インドで1990年に実施された全国教育実態調査によれば、全国の6〜14歳児(150006000万人)の約半分しか就学しておらず、人口過密な幾つかの州では就学率は更に低いという事実が明らかにされた。特に女子の未就学率が高く(62%)、非都市部の場合、こうした未就学児はいまなお生活時間の29%を「薪拾い」に、生活時間の20%を「水汲み」に使っているとの結果も明らかになった。筆者がインド各地で農村を歩いたときの実感はまさにこの数字を裏付けるものであった。こうした教育面、出版面等の対策を併せ講じつつ、デジタル技術の当該言語へのローカライゼーションを進展させるならば、デジタル空間の地球的未来は決して暗いものではない。   

 



[i] 米国商務省のNational Telecommunications and Information Administrationは、1995年以降、"Falling Through the Net"シリーズとして以下の三つの報告書をまとめている。(1) A Survey of the "Have Nots" in Rural and Urban America (1995)(2) New Data on the Digital Divide (1998)(3) Defining the Digital Divide (July 1999).

[ii] Crystal, David. 1997. English as a global language. Cambridge University Press.54頁。

[iii] カナダについては英語州の人口比78%を用いて補正している。