Sonar Members Club No.1

since September 2012

ビッグデータへの一考察

2013 OCT 17 0:00:54 am by 東 賢太郎

物事を集合的に観察することで個別事象を見ても気がつかない大きな規則性やトレンドを発見する。観察する対象は何であれ数値化して定量的に把握できるようにし、ボリューム(データ量)、速度(入出力データの速度)、バラエティ(データタイプとデータ源の範囲)を最大化することで「発見」にトライする。

素人である僕の理解はその程度だ。しかしこれは面白い。リンゴひとつから神の摂理を読み解いたニュートンとは対極だ。アームチェアにどっかり座って犯人を指摘する天才型探偵ではなく、足で歩いて泥臭く情報収集する苦労人型名探偵の登場だ。情報が多すぎて従来のデータベース管理ツールやデータ処理アプリでは処理不能なデータの集積物が「BIG」の意味するところだそうだ。

僕は株価、債券価格という非常に不可思議な行動をする数値を長年追ってきた。それを予測することに人生を賭けてきたと言っていい。それはしかし僕の脳に集積したデータベースからの予測であり、そのデータが上記の定義においてBIGであることはない。もしすべての経済関係データベースを証券市場の価格変動履歴に「タグ」づけしてそれがBIG化できれば、予測は可能になるかもしれない。それをモデル化した者はオプション価格決定モデルをつくってノーベル経済学賞を受賞したブラック博士とショールズ博士のそれと同様かそれ以上の業績ということになるかもしれない。

僕は自説があって、産業革命のデリバティブとしての発明は20世紀で出尽くしたと信じている。150年にもわたって人類の生活をグレードアップしたひとつの大きな波が終焉したということだ。それは英国に発し、米国で発展し、中国が米国化した時点で完全に終わる。しかし次の波はきっともう始まっており、それを現象面から指摘すれば、ビッグデータ解析のアルゴリズム化ということだと思っている。ここが21-22世紀の産業革命の起点となり、多様なデリバティブを生んでいくことになるだろう。

そのような話を理系の大学生である息子にした。産業革命はエンジニアが起こすものだ。法学部、経済学部なんて関係ない。パラダイム変換期なのだから既成概念などぜんぶ忘れろ。英語と同じぐらいコンピューター言語をしゃべれ。哺乳類は魚類のデリバティブで元来水中に棲むスペックで遺伝子のほとんどができている。それが陸に上がってもスペック変更できずに微修正(モデルチェンジ)で生きてきた。微修正は変革を生まない。生むのは歪みだ。人間の病気は大半それが原因だ、という本の受け売り話もした。うらやましいことに今の学生は夢のある時代に生まれている。

コンピューター言語はまったくしゃべれない僕だが、そんな話を思いつきでするわけではない。それなりに僕の脳にあるSMALLデータがそう言っている。僕がそれの専門家かどうかとは無縁である。BIGデータが自らの変革ポテンシャルをBIGデータ化することはあるだろうが、変革が起きたというデータ集積がBIG化するにはその端緒にいる僕たちは何世紀か待たなくてはならないだろう。それまではSMALLが勝つことがある。SMALLが脳内で仮説の溝を埋めながら無限に連結して、結果論的にBIGだったということになるかもしれない。アインシュタインの脳内で起きた現象はそれだったのではないかと愚考する。

検索エンジンはパワーがある。しかし人間の脳内で起きる現象をすべてネット検索するのは、たぶん不可能だろう。オンライン化していないものは検索できないからだ。誰も知らない僕の記憶などがそれだ。何世紀も待つことなくその「誰」にビッグデータ解析アルゴリズムがなれるかどうか?なったら産業革命である。

 

Categories:______サイエンス, 徒然に, 若者に教えたいこと

▲TOPへ戻る

厳選動画のご紹介

SMCはこれからの人達を応援します。
様々な才能を動画にアップするNEXTYLEと提携して紹介しています。

たむらあやこ
久保大樹
深田崇敬