流体としての情報：いかにして最悪のシナリオを回避するか

2023-03-25

流体としての情報：いかにして最悪のシナリオを回避するか

この記事に関連する話題: プロダクト開発者に求められる、これからの「倫理」の話をしよう。

“情報”とは、水のようである。それはある地点Aから地点Bへ「流れる」ものであり、しかしその流れは必ずしも一方向ではない。グラフとして表現すればハブ（本流）やコミュニティ（流域）の存在が観察され、複雑ネットワークの中で相互に影響を及ぼしあっている¹。そして時に、その激流は我々の命を脅かす。僕らは日々、雑多な情報に溺れ、ある特定の情報に対しては喉の渇きを癒す効能を見出しながら、生きている。

dam

はじめてインターネットの世界に触れたとき、情報技術は現実世界を潤すものであると確信した。オンライン上のコミュニティは水遊び場であり広大なオアシスであった。身近な水源は循環こそするが極端な流量の変化はなく、くらしに程よい活力を与えてくれた。

やがて、環境の変化によって水は溢れ (information overload)、それを支配する者が富を築く時代が訪れる。水は資本家の下に集まり、労働者は管理された水源に頼らざるを得ない。自由に使えていたあの水遊び場は、もうない。他方、さまざまな要因によって清潔な水へのアクセスが絶たれ、汚染・干ばつに苦しむ人も多く現れた (digital divide)。いや、「苦しさ」を感じた時には、もう手遅れなのかもしれない。

しかし莫大な資本をもってしても自然を完全に支配することはできず、バランスと自浄作用を失った情報の流れはいずれ地球規模の自然災害を引き起こす。

情報技術を取り巻く搾取の構造

日本文化を研究している人類学者の Gabriella Lukács は著書 "Invisibility by Design: Women and Labor in Japan's Digital Economy" の中で、インターネット黎明期の日本社会に見られたプラットフォーマーによる搾取の構造について、その問題の根深さをマルクス主義の文脈における Affective labor の概念を用いて考察している²。「やりがい」を追い求める若い女性たちの情動とフェミニズムの上で醸されたガーリーフォト、ブログ、オンライントレーディング、ケータイ小説といった文化は、高度経済成長後の日本社会に蔓延していた無力感の象徴である。インターネット企業（“持つ者”）はそれを利用することで極めて自然に“持たざる者”たちを労働力に仕立て上げ、搾取の仕組みを作り上げた。当時ブームの中心にいた女性たちへのインタビューを通して浮かび上がるのは「ちやほやされていた。でも、結局何も残らなかった」という虚無感だ。

これを1990-2000年代前半の昔話として片付けるわけにはいかない。たとえばAI技術の発展とその背後にある人的労働力の存在に見られるように、情報技術をめぐる資本家と労働者の関係は今もどんどん不均衡になっている³。情報の格差 (digital divide) について20年以上議論したところで、その差はむしろ開くばかりである。インターネットに接続できるエリアが格段に増えたという点において、インフラとしての格差はある程度改善されたかもしれない。しかし、偏った（あるいは汚染された）情報にしかアクセスできない人々と豊かな人々（“情報強者”）の間の分断が加速するばかりの現代で、果たして本当に「格差は解消された」と言える日は訪れるのだろうか？

オンラインで世界中の人をメンタリングしていると、そのような生々しい分断の現実を目の当たりにすることになる⁴。北米やヨーロッパに“トレンド”が集中しているが故に、その外側にいる彼ら彼女らが受動的に得られる情報、見えている世界は全く別のものになってしまうのだ。その状況に危機感を抱いてやってくるメンティーが多く、しかし北米在住の僕には現地コミュニティの“当たり前”を想像することができない。そもそも、誰の世界の見え方が正しいという話ではないはずなのに、我々は "Better opportunity" を求めて西側諸国の資本家を頼るしかないのが現状である。

あるいは、バーチャルな世界に蔓延する“汚水”に知らず知らずのうちに冒されてしまう例は、枚挙にいとまがない。自分の周囲の人間がインターネットサービスによって経済的・精神的におかしくなってしまうのを見るたびに、本当に悲しくなる。現代の情報技術に組み込まれた利潤追求のための搾取の仕組みは、Gabriella が1990/2000年代の日本のデジタルカルチャーに見た異質さそのものであり、この点において今日のインターネットは黎明期と比べて何も変わっていない。すでに十分肥えた市場で自分の書いたコードが数百〜千万円単位の売り上げに貢献することはあっても、身近な人間ひとりの幸福に貢献できずして何がエンジニアリングか・・・と自嘲せざるを得ない。

自然的なモノとしての“情報”

ここまでの議論における“情報”は“データ”と読み替えていただいても構わないが、僕の考える“情報”とは、現実世界を漂うもっと連続的な存在である。さらに、その影響範囲は人間の世界に留まらない。流体という自然界のメタファーを用いる理由は、ここにある。

映画『アバター』の世界観に影響を与えたと言われている森林学者 Suzanne Simard の研究によると、森の木々は地中にある根っこや菌類によって複雑ネットワークを形成しており、生存のための“情報”を相互に伝搬しているのだという⁵。そして、そのネットワークには“母なる木”—Mother Tree—とも呼べるようなハブが存在する。このような協調関係に基づく自然界のコミュニケーションプロトコルを無視し、人間本位の誤った戦略で森林を伐採すると、情報が遮断されて一帯の木々は立ち所に枯れてしまう。

情報は、自然の中でも、そして人と自然の間でも、流れている。協調よりも競争を重視してそのバランスが崩れた時、生命は致命的な傷を負う。物理学者 César A. Hidalgo は“結晶”というメタファーを通して現実世界における情報の密度に着目した議論を展開したが⁶、先のような理由から、個人的には流体としてそのダイナミクスを強調した方がしっくりくる。

さて、このように自然的なモノとして情報を捉えることで、過多、格差、汚染といった大きな問題に対するアクションプランが見えてくる。

ひとつ、フィールドワークを通して情報の流れを経験的に知る

第一に、フィールドワーク。自然の挙動や性質は局所的な環境に大きく依存する。ゆえに、観察・観測なくして議論は始まらない。複雑な世界に対してOne-size-fits-allな解決策を提示しようとするから種々の問題が起きるのであって、まずは社会の本流から疎外されてしまっている人々の生の声を聞き入れることが重要なのである—とは、AI研究者 Kate Crawford の著書 "Atlas of AI" に通底するメッセージであるように僕は読んだ。

似たような考え方を提示している文献に "Data Feminism"（データ・フェミニズム）がある。結局のところ、僕らは自分の置かれた環境・経験の中でしか世界をとらえることができず、データ（あるいは情報の扱い）にバイアスが混入することは避けられない。だからこそ、フェミニスト的な動きを現場に取り入れ、データの背後にあるコンテクストの理解に努めることが重要なのだ、というアイディア。データ・フェミニズム実践に向けた7つの原則のひとつは Make labor visible であり、これは先の Invisibility by design の議論に通じる⁷。

現場での $N=1$ の観測結果から得られるものは多い。個人的な体験としては、中学生のときに理科の自由研究で取り組んだ『千曲川（信濃川）の水質調査』がある。千曲川の水を上流から下流にかけて数カ所で採水し、BTB溶液を用いて水質の変化を追う、というものだ。同じ一本の川なのに、場所によってpHの違いが見られて考察のしがいがあったことを覚えている⁸。また、小学生のときには化石採集を頑張った。夏休みには、隣町の博物館で指導を受けながら複数の採掘場所を巡り、地質の違いを手触り感を持って知り、ほんの少しの貝の化石を手に入れた。いずれも周辺環境を実際に見ることで得られた気づきが多くあり、フィールドワークに勝る学びはないということを理解する原体験となった。

情報はどこに生じ、どのように流れ、どこでその性質が変化し、堆積してゆくのか？まずやるべきは、現場での経験を通して見えていなかった世界に目を向けること。これに尽きる。

ふたつ、観測結果を元にモデルを構築する

ある程度観測結果が集まってくると、データから一般則を導くこと（モデリング）が可能になる。先の森林学における“母なる木”の存在とその情報伝搬における役割の解明も、いくつもの実験結果があったからこその成果であり、決してスピリチュアルな話ではない。

ここまで水（液体）として情報の流れを見てきたが、“流体”と言うからには気体を考えることももちろん可能である。たとえば航空機や新幹線の設計における数値シミュレーションや遺伝的アルゴリズムの応用⁹。モデルがあるからこそ「良し悪し」が量的に定義され、そのような最適化問題を考えることができるようになる。こうした話は、中学生のときに部活動で車を造っていて初めて知った¹⁰。図書館でパラパラと眺めた流体力学の教科書はムズカシイ数式ばかりで意味不明だったけれど、乗り物の周囲を流れる気体の存在に想いを馳せて得られた「どうやら、流体の挙動は予測可能らしい」という知見は、自然界の“見えざる力”を受け入れるきっかけになった。

ただし、モデルの汎用性はあくまで元になっているデータの観測範囲に限られることを、僕たちは忘れてはならない。“母なる木”の研究はカナダ・ブリティッシュコロンビアで特定の植生に対して行われたが、全く同じ理論が地球の裏側で展開できる保証はない。同様に、平坦なコースを最高燃費で走り切るために開発された競技用の車両のカウルが、どのような気候・道路条件においても最も効率的であるとは限らない。だからこそ、フィールドワークの段階で取り入れる多様性、マイノリティを疎外しないフェミニスト的振る舞いが重要なのである。

仮に筋のいいモデルができたとして、自然を完全にコントロールしようなどとは、ゆめゆめ考えぬことだ。

みっつ、最悪のシナリオから逆算してリスク低減策を講じる

現実世界はそれほど単純ではなく、その点において我々が検討すべき究極の応用はリスク低減にある。倫理学者 Reid Blackman はAI倫理の社会実装の文脈で「良きAI (AI for Good) を作ろうなどと考えぬことだ。必要なのは、最悪のシナリオを回避するための、現実的なリスク低減の仕組みである」といったニュアンスのメッセージを発している¹¹。

“母なる木”の研究では、実験によって得られた知見から、協調と競争のバランスを保ち、生態系へのダメージを最小限に抑えるための森林伐採計画が検討できる。あるいは、津波のモデルがあるからこそ、堤防や避難場所の設置という対策を講じることができる¹²。以前、首都圏外郭放水路を見学したのだが、これも河川の増水をある程度予測できるが故のリスク低減策である。

gaikaku

僕の考える情報技術における最悪のシナリオは、現実世界の潤いが完全に失われ、周囲の人々の世界が内に閉じてしまう光景にある。でも、それはまだ十分に回避可能な問題であると信じている。

「悲しいこともいっぱいあるけれど、この世界はまだまだ美しいんですよ。」

そのことを伝え、複雑ネットワークの中にささやかな互恵性を育み、世界が潤ってゆくために、今日もできる限りの精一杯を生きている。

この悲しくも美しい複雑な世界で

「情報の流れ」を考えるための道具のひとつとして、これまで僕は推薦システムを研究・実装してきた。我々の身の回りにある情報を推薦という形で整理してあげれば、世の中が綺麗になるのではないかという期待があったから。だからこそ「流体としての情報」を意識してオンラインアルゴリズムに着目し、開発したOSSは FluRS (Flux, Fluid, Fluent Recommender Systems) と名付けた。しかし、仮に善意によるものだったとしても、「アルゴリズムによって人々が受け取る情報をコントロールする」というアプローチはいささか傲慢であったと認めざるを得ない。そもそも情報は自然の一部なのだから、必要なのは河川におけるダムや堤防に相当する“何か”と、具体的な“防災計画”だ。

加えて、実装以前のフィールドワークは明らかに不足していた。たとえば、推薦システム研究で使われるデータセットに MovieLens というユーザ×映画のレーティング情報がある¹³。果たして君は、データソースである MovieLens というサービスを実際に使い、実験用データの各サンプルとじっくり向き合い、そのコンテクストの理解に努めているだろうか？データの外側にある地域・ジェンダー別の映画の視聴傾向・配給状況の差異について、どこまで知っているだろうか？ユーザID1番の人はどのような環境で生活を営み、これまでどのような人生を歩んできたのだろうか？

「ユーザ/顧客中心のプロダクト開発をしましょう」と言うとき、このレベルでの議論が（可能ならばユーザID1番の人と一緒に）行われる必要があると、僕は大真面目に考えている。

シャノンの情報理論だけでは語れない情報伝搬の世界¹⁴。それは、人-人、自然-自然だけでなく、人-自然の間のコミュニケーションの可能性も示唆する。そして、そのような価値観で情報の流れを考えるとき、僕たちは実世界 vs. バーチャルの「どちらか」ではなく「どちらも」を対象に、相互に影響を及ぼしあうより大きなシステムに向き合う必要がある。

¹. Albert, R. and Barabási, A. L. (2002) など、グラフ/ネットワーク理論を現実世界およびデジタル上の（人のコミュニケーションも、自然界に存在するwebも包含する）“つながり”に応用する研究の歴史は浅くない。このような形でモデル化することで、たとえば Blondel, Vincent D., et al. (2008) のように、グラフから計算的にコミュニティ構造を抽出することができる。 ↩

². Wikipediaいわく、Affective labor とは "work carried out that is intended to produce or modify emotional experiences in people"（人々の感情に語りかける類の仕事）であり、広告業がその一例として挙げられている。その起源は1970年代の工場労働者の価値を問う議論にあり、今日では特にデジタル業界における Immaterial labor （取るに足らない仕事）の上位概念として用いられる。書籍 "Invisibility by Design" では (unpaid) affective labor と intellectual labor （知的労働者）の対比が繰り返し描かれる。「“かわいい”ことを労働として定義したエビちゃんの功罪」や「ケータイ小説に共通してみられる『彼氏の死』は日本社会に対する無力感の象徴である」といった興味深い考察が多数登場するので、日本人にこそ読んでほしい一冊である。 ↩

³. 流行りのChatGPTも、言語モデルに対するフィードバック収集およびコンテンツモデレーションに関するOpenAIの議論を読むと、AIシステムが未だ人間の入力に強く依存していることが分かる。あるいはAmazon Mechanical TurkやGoogle reCAPTCHAのように、プラットフォーマーが規模の力を使って格安（あるいは無料）の労働力を大量に獲得することは、もはや当たり前になってしまっている。 ↩

⁴. 最近はADPListとMentorCruiseというプラットフォーム上でオンラインメンタリングを提供している。単発でのセッションにフォーカスした前者は無料なこともあり、東南アジアや南米、アフリカ諸国からのメンティーも多い。 ↩

⁵. “母なる木”の研究についてはTEDトークでその概要を聞くことができる。書籍 "Finding the Mother Tree: Discovering the Wisdom of the Forest" にはさらに詳細な研究の歩みが先生の半生と共に描かれており、大変濃密な一冊となっている。『アバター』の“魂の木”のアイディアがこの研究にインスパイアされたものであるという話は有名。 ↩

⁶. 書籍 "Why Information Grows"（邦題『情報と秩序』）を参照。「プロダクトとは、世の中の“情報”が結晶化したモノである」といった表現が繰り返し登場する。 ↩

⁷. データ・フェミニズム実践のための7つの原則は、Examine power, challenge power, elevate emotion and embodiment, rethink binaries and hierarchies, embrace pluralism, consider context, and make labor visible から成る。ここでいう“フェミニズム”とはジェンダーに限った話ではなく、社会の本流から疎外されてしまっているすべての者たちの“力”への挑戦を意味する。 ↩

⁸. 環境省の水質調査方法に関する資料を眺めていると、採水時間や天候など、実験計画的な意味で当時の自由研究はツッコミどころ満載だったなぁと思うわけだが、それもまた貴重な学びである。 ↩

⁹. 飛行機、新幹線、ロケット設計の現場において、進化計算を用いた形状の最適化は当たり前に用いられるテクニックであるという。（参考：ISASメールマガジン　第423号） ↩

¹⁰. オリジナル車両を製作してその燃費を競うエコランというものを中学生のときにやっていた。車体の重量のほかに、空気抵抗（全体の形状）と転がり抵抗（タイヤ）が重要な指標となる。 ↩

¹¹. AI倫理の社会実装について、書籍 "Ethical Machines" で語られる内容。“倫理”とは決して主観的/抽象的なものではなく、ビジネス/法的リスクを低減するためのフレームワークとして、極めて実用的なツールなのだという主張が展開される。Blackmanは、そのために企業が倫理学者や哲学者を雇うことの重要性を説いている。 ↩

¹². 他方、リスクマネジメントに失敗すれば、3.11原発事故のような最悪の事態が現実のものとなってしまう。書籍 "A Bright Future: How Some Countries Have Solved Climate Change and the Rest Can Follow" の中で国際関係学者の Joshua S. Goldstein と原子力エンジニアの Staffan A. Qvist は、福島原発事故は不十分なリスクマネジメントが引き起こしたものであり「『災害』と呼ぶよりも（人が引き起こした）『パニック』と呼んだ方が適切である」と述べている。 ↩

¹³. MovieLensはミネソタ大学の推薦システム研究グループGroupLensが提供する映画のレビュー・推薦サイト。ここから得られたデータセットは、推薦システム研究における性能評価の場面で広く利用されている。 ↩

¹⁴. 強調したいのは、ビットで離散的に表現できるものだけが“情報”ではない、という点である。仮にデジタルな世界だけを考えたとしても、Ahmad, N. (2021) が指摘するように、シャノンの情報理論に従う限りにおいてデータ（情報）とは必然的に“漏れる”ものであり、この点において「情報の流れ」を観察・モデリングすることの意義は揺らがない。 ↩

この記事に関連する話題: プロダクト開発者に求められる、これからの「倫理」の話をしよう。

カテゴリ

機械学習データサイエンスエッセイ

書いた人: たくち

たくちです。長野県出身、カナダ・バンクーバー在住のソフトウェアエンジニア。これまでB2B/B2Cの各領域で、Web技術・データサイエンス・機械学習のプロダクト化および顧客への導入支援・コンサルティング、そして関連分野のエバンジェリズムに携わってきました。現在はフリーランスとして活動を続けつつ、アフリカ・マラウイにて1年間の国際ボランティアに従事中。詳しい経歴はレジュメを参照ください。いろいろなまちを走って、時に自然と戯れながら、その時間その場所の「日常」を生きています。ご意見・ご感想およびお仕事のご相談は [email protected] まで。

寄付で活動を支援する一杯のコーヒーを贈る

免責事項

Amazonのアソシエイトとして、当サイトは amazon.co.jp 上の適格販売により収入を得ています。
当サイトおよび関連するメディア上での発言はすべて私個人の見解であり、所属する（あるいは過去に所属した）組織のいかなる見解を代表するものでもありません。
当サイトのコンテンツ・情報につきまして、可能な限り正確な情報を掲載するよう努めておりますが、個人ブログという性質上、誤情報や客観性を欠いた意見が入り込んでいることもございます。いかなる場合でも、当サイトおよびリンク先に掲載された内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。
その他、記事の内容や掲載画像などに問題がございましたら、直接メールでご連絡ください。確認の後、対応させていただきます。