可視化の歴史/歴史の可視化


データビジュアライゼーションは、その理論と実践の関係において、ある種の危機に瀕している。この領域は言わば「パラダイム・ジャングル」と化しているために、理論における統一的・普遍的な妥当性を構築できずにいるのである。直ぐに思い付くものを列挙するだけでも、多くの観察者が多様な角度からそれぞれに可視化の理論化に努めていることがわかる。

  • 系統図にはじまる図形表現の公理化に努めてきた「離散数学」(Semple, C., & Steel, M. A., 2003)。
  • 統計学理論との関連からデータや情報のグラフ化の手法を提供する「統計グラフィクス」(Tukey, J. W., 1977)。
  • データや情報の様相や変異のパターンの図形化を試みる「インフォグラフィクス」(Lima, M., 2013)。
  • あるいはエルヴィン・パノフスキーの「図像学(iconography)」に由来する仮象と形象の歴史的意味論(Watson, A. 1934)など。

上記のように、特に幾何学的な発想に基づいたダイアグラム(geometric diagrams)に限定して観ても、「可視化」のための理論が体系化された状態で記述されているとはお世辞でも言えない。

研究開発に専念できるエンジニアやリサーチャーならば、先行研究に時間を割けば良いだろう。しかし、ビジネスとの関連からはITコンサルティング的な役割を、システムとの関連からはソフトウェア・アーキテクト的な振る舞いを実践せざるを得ないデータサイエンティストにとって、このデータビジュアライゼーション界隈の些か錯綜した状況を探索するほどの十分な余裕は持てないかもしれない。データビジュアライゼーションの概念を知るには何処にポイントを定め、何処に問題意識を見出せば良いのかについて、一定のオリエンテーションが必要であるように思える。

統計的歴史学


この記事では、概念史や研究史を素描することでデータビジュアライゼーションの理論的背景を整理していくことを目指している。だが過去の個別具体的なデータビジュアライゼーションを「博物館」のように陳列して鑑賞するだけでは、統一性や普遍性や妥当性の観察に不可欠な抽象化の取り組みが疎かになる。同様の理由から、「最先端のテクノロジー」の流行を追い、TableauやD3のような可視化の「ツール」の「まとめ記事」を記述するというのも論外となる。

理論が真に統一的・普遍的に妥当する知を記述するには、その理論の言明が当の理論そのものにも適用可能でなければならない。その統一性や普遍性の対象範囲の全体には、その理論そのものも含まれているためである。したがってこの記事のアプローチは、マイケル・フレンドリー(Friendly, M., 2008)の「統計的歴史学(Statistical historiography)」がまさに先駆的な姿勢として示しているように、「データビジュアライゼーションの歴史」を「データ」として「可視化」するという、「自己言及的な方法(self-referential way)」となる。

「可視化の歴史の可視化」は、可視化の歴史の中の不可視なものの発見を可能にする方法として機能する。これにより、この自己言及的な営みは、「可視化」の概念そのものを変容させることになる。「データビジュアライゼーションの歴史」を遡及することは、「データビジュアライゼーションの将来像」を記述することに等しい。これを踏まえれば、この方法は演繹的でもなければ帰納的でもない、発見があれば良しとする探索的な概念実証(Proof of concept)となる。

データビジュアライゼーションの前史


データビジュアライゼーションの前史にあるのは、幾何学的なダイアグラム(geometric diagrams)を用いた地図の設計である。こうしたダイアグラムは、星や様々な天体の位置座標や、地理的な探索に役立つ地図の作成に利用されていた。この幾何学的な発想は、当時町を構築していた古代エジプトの測量士たちによって提唱されている。古代ローマの学者であるクラウディオス・プトレマイオスは、地球の地理的な情報を「緯度」と「経度」の形式で可視化しようと試みた。それが球状の地図投影(map projection)という概念を生み出した。このノウハウは、遅くても14世紀までの間は標準的な地理情報の可視化方法として参照され続けている。

16世紀になると、物理量を精確に測定する技術や器具が実装されるようになった。展望台や三角測量法、日蝕を記録する画像の直接的な投影方法など、様々な方法が提案されるようになったことで、天体のような地理情報の可視化方法は更に発達していった。

17世紀の最も重要な参照問題は、時間、空間、距離に関する天体、測量、地図作成、航行の物理的な測定であった。その測定結果の可視化は、「領土拡大」という全く以って政治的な目的意識から利用されていた。とはいえその方法を発展させたのは、近代科学に他ならない。デカルトやフェルマーによる解析幾何学、初期ガリレオによる測定誤差の理論と推定、パスカルらによる確率論の誕生、まだ経済学と統計学が十分に分化していなかった頃の算術法を築き上げたジョン・グラントによる人口統計学の創出など、徐々に可視化の方法が科学的な理論として記述されるようになったのである。

17世紀が終わる頃には、科学的な実験方法という観点から、グラフィカルな可視化の方法の開発に必要な要素が特定できるようになった。それは、興味を引き重要と思われる「現実のデータ(real data)」、そうしたデータに意味を付与するための「理論(theory)」、そしてデータの「視覚的な表現(visual representation)」を可能にする「アイディア(ideas)」である。言うなれば17世紀は、データビジュアライゼーションを「視覚的思考(visual thinking)」の一環として基礎付けたのである。

データビジュアライゼーションの黄金時代


18世紀から19世紀前半にかけて、更に豊富なグラフィックスが提供されるようになる。例えば地図作成においては、地図上の地理的な位置情報のみならず、等値線や等高線などのような新しい概念が表現されるようになった。語源や字義を辿れば済む話でもないが、字義的には、この段階で徐々に「写像(mapping)」概念に基づいた発想が可視化の方法として根付くようになる。つまり文字通り、地図のような既知の図形の中に新しい情報を「マッピング」していく発想だ。このアイディアは、地理のみならず、経済、政治、医療などの分野でも採用されるようになった。

棒グラフ、円グラフ、ヒストグラム、折れ線グラフ、時系列のプロット、散布図など、今でこそ周知となっているデータビジュアライゼーションの主要な方法が出揃ったのは、19世紀の前半である。気象情報、磁力線、潮汐などのような自然現象や物理現象の可視化にも、これらの方法が採用され、次第に学術論文にも掲載されるようになった。そして19世紀中盤から後半にかけて、ガウスやラプラスに始まる統計学理論が幅広く応用されるようになり、その可視化の対象範囲が全体社会にまで及ぶようになった。この影響から、社会計画、工業化、商取引、輸送のための定量的な情報の重要性が社会的に認知されるようになった。

データビジュアライゼーションの暗黒時代


19世紀がデータビジュアライゼーションの「黄金時代(golden age)」であるとすれば、20世紀前半は「暗黒時代(dark ages)」である。この時代には、グラフィカルな方法についての革新がほとんど起こっていない。1930年代半ばには、1800年代後半を特徴付けていた可視化に対する熱意は、定量化や統計的モデルに対する熱意に移り変わっていった。

技術史的には、この頃には既に「カメラ」という複製技術が普及している。しかし視覚的情報の記録媒体であるこのテクノロジーがデータビジュアライゼーションとほぼ接点を持たなかったことは、逆にこの時代のデータビジュアライゼーションの限界を物語っている。端的に言えば、写真のような二次元情報では、統計学理論が要求する多次元データの可視化が間に合わなかったのだ。

尤もこの状況は、データビジュアライゼーションが終焉を迎えたことを意味するのではなく、次の時代の革新に向けた準備段階を意味している。データビジュアライゼーションは、新しいアイディアとそれを可能にするテクノロジーを待ち望んでいた。そのテクノロジーとは、カメラでもなければ映画でもない。それは更にその先を行く、C言語やUNIXをはじめとするコンピュータ技術である。

コンピュータとの合流


20世紀は、データビジュアライゼーションがコンピュータによって拡張された時代である。コンピュータとコンピュータグラフィクスが無ければ、多変量解析や次元削減の理論的な発達はあり得なかっただろう。またコンピュータに実装されているユーザー・インターフェイスは、データのインタラクティブで動的な可視化を初めて可能にした。データマイニングのヒューリスティックで発見探索的な姿勢も、コンピュータのユーザー・インターフェイスが無ければ実現が困難となる取り組みであった。

コンピュータから可視化の自由度を得たことを背景に、データビジュアライゼーションの領域には、「科学的可視化(scientific visualization)」と「情報可視化(information visualization)」の区別が導入されるようになった(Tory, M., & Moller, T., 2004)。「科学的可視化」はその専門領域に固有の具体的な諸要素で構成された科学的データを対象としている。この可視化は、連続的モデルの可視化(Continuous model visualization)とも言い換えられ、データの連続モデルを利用するあらゆる可視化のアルゴリズムを包含する。こうしたアルゴリズムは、たとえデータの値が離散的であっても、それを連続的な現象として学習できると想定されている。一方、「情報可視化」は抽象的で非空間的なデータを対象としている。この可視化は、言わば離散モデルの可視化(Discrete model visualization)であって、その多くが離散データを対象としている。

キュレーションメディアについてのキュレーションメディア


データビジュアライゼーションとの関連から観れば、ビッグデータの流行は、21世紀のデータビジュアライゼーションの様相を早くも特徴付ける出来事になった。それまでのデータビジュアライゼーションは、科学的可視化にせよ、情報可視化にせよ、一部の学術的な専門機関の営みに過ぎなかった。ところがビッグデータが流行り始めた頃から、徐々に企業の方が大量データのストレージを所有するようになる。その結果、大量のデータから特定のデータを抽出して可視化するニーズが一般化するようになった。

専らビジネスとの関連から要求されるのは、「アクションに結び付く発見」だ。経営学的に言えば、組織は目的を達成するシステムではなく、目的を追求するシステムに過ぎない。組織は、追及すべき目的を決定し、達成するための計画を決定し、その役割を担う構成員を決定し、目的達成状況の評価や成果を決定する。

こうした諸々の意思決定の機能は、「不確実性の吸収(absorption of uncertainty)」にある(Simon, Herbert Alexander., 1969)。意思決定は、複数の選択肢の中から特定の選択肢を選択する営みであると同時に、裏を返せば、他の選択可能な選択肢の否定も意味する。意思決定は、特定の選択肢を顕在化させると共に、その他の選択肢を潜在化させる。まさに下位組織や構成員の「選択と集中」を促すのが意思決定であると言える。逆に意思決定事項が明確ではない組織では、構成員が何を目指せば良いのかわからないまま右往左往する状況が生み出される。

これを前提とすれば、データビジュアライゼーションは意思決定者の負担軽減として機能する。意思決定者が選択する選択肢を予めフィルタリングしておくことで、意思決定者が吸収すべき不確実性をある程度吸収しておくことが、可視化の機能であるという訳だ。

情報過負荷の時代背景からすれば、意思決定者の興味を引く情報を目立つように可視化すれば良いと発想してしまうのも無理はあるまい。そうしたエンドユーザーの注意を引き、アクションのトリガーとなり得る情報を絞り込むという訳だ。しかし、そうした目的意識から、例えば「有用」と思える「マーケティング・ダッシュボード」を構築しても、エンドユーザーがそれを使いこなせなければ「無用」の産物となる。

エンドユーザーが可視化ツールを使いこなせない可能性というのは、勿論エンドユーザー自身の能力や知識にも左右される問題だ。しかし、むしろここで注意しなければならないのは、フィルタリングの逆機能である。皆がエンドユーザーの興味を引く情報を目立つように可視化すれば、それ自体が情報過負荷を派生させる。複数のデータが可視化されれば、それらを取捨選択しなければならない。この派生問題は、喩えるなら、キュレーションメディアの乱立によって「まとめのまとめ」が必要になってしまうという皮肉と類似している。

不可視性の不可視性


かくしてデータビジュアライゼーションは、一つのパラドックスに直面した。

TableauやD3などのような可視化のツールやデータマイニングや検知技術のような方法に目を向けるだけでは、何を「可視化」するのかという問いが盲点となる。「可視化」の対象となるのが「不可視」のデータの関連性であると想定するだけでは、それを何のために「可視化」するのかが不明確なままだ。形式的に言えば、データビジュアライゼーションは「不可視性」と「可視性」の区別の導入によって始まる。しかしこの「不可視性」と「可視性」の区別それ自体が、その様々な問題設定や目的意識との関連から、「不可視」に留まる傾向にあるようだ。「何を可視化すべきなのか」も「不可視」であり、それ以前に「何が不可視なのか」も「不可視」なのである。

データビジュアライゼーションのアクチュアルな問題となっているのは、データビジュアライゼーションについての情報が玉石混淆の中で埋もれ、データビジュアライゼーションについてのデータがそれ自体不可視になっているという点に要約される。冒頭で取り上げた「パラダイム・ジャングル」は、この事象を科学論文の中に限定した場合の事例の一つに過ぎない。この問題は多くの人間が可視化に関与するようになったことで顕在化した問題だ。可視化のための新しいツールやライブラリを紹介するだけのまとめ記事を記述するような観点では、この問題は解決されない。形式的に言えば、この問題の背後にあるのは、「不可視性」と「可視性」の区別それ自体が「不可視」であるというパラドックスであるためだ。

そうなると我々は、この区別を棄却し、別の区別による別の観点から、データビジュアライゼーションという概念を見詰め直さなければならない。一旦「可視化」への志向を断念することでしか、データビジュアライゼーションに新しい風を吹き込むことはできないのである。

「視覚化」としての「可視化」は如何にして可能になったのか


上述したように、データビジュアライゼーションの歴史を素描してみるだけでも、その奇妙な側面に気付くことができる。確かに可視化の方法はコンピュータの普及によって多様化し、深化もした。だがそれが原理的に「視覚的思考」の表現であるという点では、17世紀から何も変わってはいない。グラフのバリエーションが増え、多次元データにも対応でき、紙媒体ではできなかったインタラクティブな可視化すら実現している。しかし、歴史的にデータビジュアライゼーションは、「視覚化」としてしか発展していなかったのである。

「可視化」という概念の意味を「視覚化」に限定しなければならないと考える必然性は全く無い。我々の感覚は、視覚のみならず、聴覚味覚嗅覚触覚からも構成されているはずだ。17世紀の人間と現代の人間の感覚器官に大きな差異があるとも思えない。だとすると、「視覚化」としての「可視化」が事実上の標準であるかのように取り上げられているのは、歴史上偶発的な事象であったと推論できる。歴史の展開次第では、聴覚や触覚を重視した「可視化」もあり得たはずなのだ。

Visualizationという概念の意味論は、注意深く見直されなければならない。データビジュアライゼーションの設計思想を探求しているトマス・エリクソン(Erickson, T., 1986)も述べているように、発音し難い用語ではあるものの、むしろ「知覚化(Perceptualization)」の方が相応しいだろう。実際、聴覚的な刺激や触覚的な刺激は、視覚的な刺激と同様に、データを表現するメディアとして活用できるはずだ。

視覚芸術の美学


「視覚化」としての「可視化」の事実上の標準化が如何にして可能になったのかという問題設定において、美学(Ästhetik, Aesthetics)は有用な知見を提供している。周知(Szamosi, Geza., 1986)のように、ギリシアの視覚芸術が空間概念を超自然や迷信から解放して以来、空間とは論理的で客観的な性質を有していると想定されるようになった。続くルネサンス期の芸術家たちは、この空間概念を所与のものとして位置付けるようになる。つまり、ある「図」となるモノの「地」として空間が認識するのではなく、初めに一定の空間が設定してから事物を描写するようになった訳だ。そしてこの視点の転回が、三次元空間の視覚化を促す「遠近法」の様式を基礎付けることになる。ルネサンスの芸術家たちが明らかにしたように、モノの大きさは、距離と共に、徐々に小さくなる。そして鑑賞者から観れば、遠ざかる平行線は、最終的には一点に収束する。

この様式は、レオナルド・ダ・ヴィンチやアルブレヒト・デューラーをはじめとした当時の芸術家たちに多大な影響を与えた。それと同時に、彼ら偉人たちの営みが、人間の空間知覚を視覚芸術的に探究する歴史の発端をも形成した。二次元平面上に三次元空間を描写するという遠近法の様式は、視覚優位の歴史の伏線にもなっている。データビジュアライゼーションの前史は17世紀であったが、ルネサンス期は既に14世紀には始まっている。

活字文化の五感配分


15世紀には更に、ヨハネス・グーテンベルグが活版印刷術を発明している。この複製技術が社会的に普及されたことで、視覚優位の傾向が助長されていた(McLuhan, Marshall., 1962)。確かに、まだアルファベットが普及する以前の社会では、人間のコミュニケーションは五感の全てを駆使することで成立していた。何かを物語るには、話し言葉のみならず、身振り(ボディ・ランゲージ)も必要とされたからだ。そのため単に情報を共有するだけでも、視覚と聴覚、場合によっては触覚も要求された。

だがアルファベットという書き言葉が普及すると、聴覚や触覚に訴える必要が無くなる。その場に居合わせて、対面で接する必要が無くなるからだ。グーテンベルグの活字文化は、五感配分における視覚の比率を高めた。その結果、聴覚や触覚は周辺的なものに過ぎなくなったのである。

データビジュアライゼーションの脱視覚化


視覚芸術と活字文化は、データビジュアライゼーションの前史となる17世紀には既に、可視化が視覚優位となる伏線を張っていたと考えられる。しかし五感配分の変異は不可逆ではない。美学的な芸術の探究や複製技術の発展によって人間の五感配分が変異するとするなら、別のアプローチ次第では、視覚優位を相対化することも、あるいは別の感覚を優位に立たせることも不可能ではないはずである。原理的にあらゆるメディア技術は人間の「感覚比(Sense Rations)」を変える(McLuhan, Marshall., 1964)。先の活版印刷術による視覚の優位化は一例に過ぎない。

実際、カメラとほぼ同時代に生み出された映画のような複製技術は、映像による視覚化のみならず、音響効果による聴覚刺激も可能にする。それだけではない。こうした複製技術は、本来身近には無かったモノを我々の近くにあるかのように演出する。例えば『インデペンデンス・デイ』のような映画は、「宇宙船」や「エイリアン」のような日常からは程遠い存在を観客に突き付けてくる。観客は、こうした視聴覚的な神経刺激を全身で浴びることで、言わばその「体験」を「触覚的に(taktische)」享受する(Benjamin, Walter. 1935/1936)。観客は、こうした本来身近ではなかったモノを目で視て頭で理解するというよりは、その体験を身体の習慣形成によって受容していくのである。

コンピュータという名の複製技術もまた、視覚のみならずあらゆる感覚に訴え掛けることを可能にする電子メディアである(McLuhan, Marshall. 1964)。現代においてこのことは、VR(Virtual Reality)を連想するだけで、容易に理解できるであろう。イヴァン・サザーランドらが設計した「ヘッド・マウンテッド・ディスプレイ(Head-Mounted Display : HMD)」は、頭部に装着するハードウェア・アーキテクチャからユーザーに三次元的かつ視聴覚的な神経刺激を呈示する「没入型メディア(Immersive Media)」として知られている(Sutherland, Ivan E. 1968)。今更事例を紹介するまでもなく、VRは運転訓練や危険物の取扱のシミュレーターとしての機能を担っている。パノラマ的な360度映像は様々な体験の習慣形成を促している。

データビジュアライゼーションのプラットフォームとしてのVR


既にデータビジュアライゼーションの未来を見据えている者たちは、データビジュアライゼーションとVRの関連付けの可能性に気付いている。と言うのもVRは、しばしばデータビジュアライゼーションのプラットフォームとしても位置付けられているためである。

我々の感覚器官は、物理空間を三次元的に認知するように最適化されてしまっている。だが実際に可視化することになるデータは超次元的(hyper dimensional)である。確かに次元削減の方法は多数存在している。だがそれが常に適切である訳ではない。次元は削減すれば良いという訳ではない。むしろ効果的に可視化できる次元が高まれば、それだけ潜在的に興味深いパタン、相関、あるいは異常値を検出する機会が増えることになる。VRとデータビジュアライゼーションの組み合わせは、超次元のデータの抽象的な表現を可能にする。VRは、言わばデータの汎用的な探索ツールなのである。それはデータの探索から発見までの「認知的なボトルネック(cognitive bottleneck)」を解消してくれる。

「可視化は、データの定量的な内容と人間の直感の間の主要な橋渡しとなる。そして、何らかの方法で可視化できないものならば(数学的な構造を含めて)何であれ、我々はそれを真の意味で理解することも直感的に把握することもできないのだと主張することができる。」
Donalek, C., Djorgovski, S. G., Cioc, A., Wang, A., Zhang, J., Lawler, E., & Davidoff, S. (2014, October). Immersive and collaborative data visualization using virtual reality platforms. In Big Data (Big Data), 2014 IEEE International Conference on (pp.609-614). IEEE., 引用はp.609より。

しかしながらこの主張は、n次元の数学的解析の複合性を3次元のVR空間へと縮減することを強く意識するあまりに、ユーザー体験(User Experience: UX)の様相を捉え損ねている。実際のところ、VRで共有された体験に没入しているユーザーは、その視聴覚的な神経刺激の一つ一つを「次元」によって体感している訳ではない。この場合の次元は、ユーザーが体験する事象の断面や切片のようなものだ。だがそれはユーザビリティ調査法や「UXメトリクス(UX metric)」(Albert, W., &; Tullis, T., 2013)などのようなデータ化の方法によって初めて構成される、単なるデータ分析者の概念である。一方ユーザーは、事象を事象そのものとして体験する。VRのユーザーは決してダイアグラムとして視覚化された事象の断面を体験するのではない。

アクションへの結び付き

したがってVRの体験共有は、視覚優位の可視化を否定すると共に、データの次元の区別を棄却している。それ故にこそVRには、全く新しいデータビジュアライゼーションとしての可能性が秘められているのである。ビジネスとの関連から要求される「アクションに結び付く発見」においても、VRは幾何学的なダイアグラム論に対する有力な代替案となり得る。下手に抽象的な図形で視覚化するよりも、「価値転換」を促すような美的で衝撃的な体験によってアクションを誘発させた方が、余程効率的な場合もあるだろう。VRの体験共有は、可視化されたデータに基づいた合意形成や「データドリブン」な意思決定へと背伸びすることから我々を解放してくれる。

無論、視覚的思考の表現としての可視化が不要になる訳ではない。Excelのような「表計算ソフト」やTableauのようなBIツールによるデータビジュアライゼーションが多少刺激に乏しく「パッとしない」可視化となっていても、機械的なルーチンワークによる数値の共有程度には役立つはずだ。また、Mixed Reality(MR)のような比較的新しい技術に目を向けるなら、データビジュアライゼーションの脱視覚化を可能にする方法はVRだけではないかもしれない。新しい可視化の探究はまだまだ始まったばかりである。

参考文献


  • Albert, W., & Tullis, T. (2013). Measuring the user experience: collecting, analyzing, and presenting usability metrics. Newnes.
  • Benjamin, Walter. (1935/1936) “Das Kunstwerk im Zeitalter seiner technischen Reproduzierbarkeit (Zweite Fassung)”. In: Gesammelte Schriften Bd.VII/1, Frankfurt am Main : Suhrkamp, 1989. S.350-384.
  • Bryson, S. (1996). Virtual Reality in Scientific Visualization. COMMUNICATIONS OF THE ACM, 39(5), 63.
  • Donalek, C., Djorgovski, S. G., Cioc, A., Wang, A., Zhang, J., Lawler, E., … & Davidoff, S. (2014, October). Immersive and collaborative data visualization using virtual reality platforms. In Big Data (Big Data), 2014 IEEE International Conference on (pp.609-614). IEEE.
  • Friendly, M. (2008). A brief history of data visualization. Handbook of data visualization, 15-56.
  • Lima, M. (2013). Visual complexity: mapping patterns of information. Princeton Architectural Press.
  • McLuhan, Marshall. (1962) Gutenberg Galaxy, The Making of Typographic Man, Toronto.
  • McLuhan, Marshall. (1964) Understanding Media : The Extensions of Man, New York : New American Library.
  • Semple, C., & Steel, M. A. (2003). Phylogenetics (Vol. 24). Oxford University Press on Demand.
  • Simon, Herbert Alexander. (1969) The sciences of the artificial, Cambridge, MA.
  • Sutherland, Ivan E. (1968) “A head-mounted three dimensional display,” Fall Joint Computer Conference, Proceedings of the AFIPS, vol. 33, pp757-764.
  • Tukey, J. W.(1977). Exploratory data analysis. Reading: Addison-Wesley.
  • Watson, A. (1934). The early iconography of the Tree of Jesse. Oxford University Press.
  • Wilkins, E. H., & Salutati, C. (1923). The Trees of the Genealogia deorum of Boccaccio. Caxton club.