ビッグデータで社会問題を解決!想像もできないアウトプットが現れるデータの可能性

ビッグデータで社会問題を解決!想像もできないアウトプットが現れるデータの可能性

膨大なビッグデータを活用して、新しい公共サービスを収益性のある事業として立ち上げようと奮闘している東富彦(あずまとみひこ)さんに、ビッグデータとはどういうものなのか、私たちの生活にどうかかわっているのか、そして今後の可能性をとことん聞き取りました。

東富彦

ビッグデータが持つ可能性

私は公益財団法人の九州先端科学技術研究所(ISIT)で、データを活用した新しいサービスの立ち上げに従事しています。福岡市などと一緒に、データを活用した公共的な新しいサービスを、特に地元の事業者とどう立ち上げていくかという仕事ですね。

― そもそもビッグデータというのは、どういうものなのでしょうか?

私の本来の専門はオープンデータです。オープンデータというのは、政府や自治体が持っている公的なデータを公開して、商用利用も含めて自由に使えるようにし、それによって新しい産業やサービスを興していこうというものです。

それを世界中の政府が促進することになって、日本政府も政策にして実行しています。たとえば気象データ、衛星画像データ、土壌や農産物の生産高のデータなど、過去に遡れば膨大なデータ量になります。オープンデータが始まったことによって、このビッグデータというものが非常に注目されています。

東富彦

また、GoogleやFacebookがやってるように、ユーザーの行動をトラッキングするような形でデータを集める人たちもいますが、集めた大量のデータを公開しないので、ビッグではあるけどこれはクローズなデータです。政府が出してるものはビッグで、かつオープンなデータです。この2つを組み合わせて、様々なことをやろうという人たちが多く出てきています。

データの質は20年前とはまったく違う

― そのクローズなほうのデータですが、例えばGoogleの情報は買えるのですか?

昔から個人データを売買するビジネスは盛んに行われています。たとえば、ある人に関するデータとして、1500項目くらいの属性データを調べて売るんです。それを買ったほうはそのデータから、「この人が車を買うとしたらベンツが有力だな」とか、あたりをつけるのに使うんですね。決して最近の話ではなくて、そういったデータの売買は昔から活発に行われていました。

Advertisement

― 例えば20年前と比べて、そのデータの内容や質は変わってきているのでしょうか?

20年前だと、データの発生源が政府や個人に限られていたのですが、今のようにこれだけセンサーが至るところにあると、そういうデバイスが次から次にデータをあげてきます。ですからデータ量は爆発的に増えていますし、取れるデータの種類も広がっているし、データもリアルタイムのものとか、状況はまったく違っています。

衛星画像で漏水箇所を見つける

― ビッグデータと聞くと、国や大企業が活用するイメージを持つのですが、中堅や中小企業がそういうデータを活用している事例はありますか?

たくさんありますよ。特に最近は衛星画像を利用しているケースが多いですね。たとえばNASAのデータは大量に公開されていて、フリーで使えます。もっとも膨大な量だから、ふつうのマシンでは分析できませんが、その画像データを使って農作物の収穫高予測をするサービスを数人のスタートアップが提供しています。

コンピューターリソースは膨大に必要ですが、あとは頭脳だけですね。日本の「だいち2号」という衛星が撮影した画像も、今はまだ有料ですが、イスラエルのある企業はこの画像を分析して、水道管の漏水個所を見つけるのです。地中1~3mの深さが分析できるので、漏水個所を100mの誤差だけで見つけることができるのですね。

漏水を見つけるのに検知器を持って歩くと、何百キロも歩かなきゃいけないしコストも大変です。でもこれを使えば、100mの範囲を調べればいいので、画期的にラクになります。それが画像だけでできちゃうのです。

検索アプリのログからバス会社設立

― 普通の人やビジネスマンが、身近にビッグデータを実感できる例はあるのでしょうか?「気づかないうちに実は使っていた」そういった事例は?

イギリスにCitymapperという、ルート検索アプリを開発している会社があります。例えばA地点からB地点に行きたい人が、何月何日の何時頃に何人いたかということが、ルート検索のログを集めてるとわかるわけです。そうすると、今の公共交通機関だけ使っちゃうと非常に非効率的な移動になることもわかります。

でも、そこに行きたい人がある程度以上の人数ならば、「そのルートに新しくバスを走らせたらどうか?」という発想が出てきますね。Citymapperはそういったルートを割り出すためのSimcityというアルゴリズムをつくって、ルートを割り出しをして、さらに自分たちで商業バスの免許を取って、実際にロンドンの街でバス運行を始めたのです。

“なんでここにバス路線ができたのかな?”と市民は思うかもしれないけど、その裏にはルート検索で集めた膨大なログがあるのですね。

Advertisement

― そのルート検索の会社は、検索サービスを提供してたらたまたま、バス会社をやることになったって想像するのですが。

そうですね。たくさんのログがたまってきますから、これを何かに使えないかと考えたと思います。ロンドンも公共交通機関に大きな問題を抱えています。市の中心部に人口が集中するので、2030年くらいまでに通勤通学者が約60万人に増えるのです。

それをどうやって運んだらいいのか、それが市の大きな課題になっていて、そのためには公共交通をなんとか効率的に運用しなくちゃならない。それは市の交通局だけではできないから、民間の力も使わないといけない。そこでCitymapperのように、新しいルートを、きちんと収益もあげられる形で商業運用を始めてくれれば、市としても大助かりなわけです。

東富彦

データを使ったビジネスは数人で起業できる

― データを集めて、見極めて、活用する。アタマひとつでビジネスが成り立っちゃう時代なのですね。

一番重要なのは、“現場での課題をいかに発見するか”なんですよ。最近の例を農業で言うと、非常に広大な農地を持っているんだけど、広大なせいで現状では水の管理にも多くのコストがかかってしまう。

そこで衛星画像を使って、水がきちんと行き届いているかを見るんです。画像で緑の箇所はOK、赤になってれば足りませんよ、と教えてくれる。そういうサービスを提供する会社があって、それで30%くらい収穫量が上がったんです。

知らない人は土壌にセンサーをばらまけばって言うのですが、それだと何万個ものセンサーが必要になる。課題をどうとらえて、それをどう解決するかを、きちんと考えられることが大事です。そこまでできてある程度のお金を払えば、あとはデータはどこからでも手に入れられる時代になってきています。

昔はそれが完全にクローズドされてて、企業が独占してビジネスをやってましたが、今はデータを入手しやすくなっているので、データを使ったビジネスを始めるのは、大企業よりスタートアップ系のほうがはるかに多いです。

私はずっと日経BPのビッグデータ総覧などに、特に海外の事例を多く書いているのですが、それを見ても数人で立ち上げたスタートアップが非常に多いです。中でも多いのは、事業センスのある研究者がうまくスピンアウトして事業を立ち上げちゃうケースです。今だとAmazonのクラウドサービスを使えば、手持ちのコンピュータ資産はいりません。

お金はかからないし、データは手に入るし、あとは自分の頭でアルゴリズムさえつくれば、もうそれでサービスの出来上がり。だから、みんなそこに飛びつくんですよ。一度うまくいけば、それを広げるのは難しくないし、Amazonがどんどんコンピュータリソースを提供してくれるし、データもそのへんから手に入る。そのモデルでやってるところは多いですね。

― データは買えるということでしたが、実際に、どこでどう買ったらいいのですか?

例えばビッグデータ総覧という本があります。「こういうデータはどこで手に入るよ」という一覧が何十ページもあって、個人で調べるのは大変ですけど、そのリストを入手して利用すれば、そんなに難しくはありません。日経BPが出している「AI・IoT・ビッグデータ総覧」ですね。年に1回出してますけれど、そこにデータ源の一覧があるから、そういうのを参考にしてくれれば。

Advertisement

オープンデータの機運はG8から

― 少し話が変わるんですが、九州先端科学技術研究所で、東さんはどういう立場で仕事をされてるのでしょうか?

役職で言うと、イノベーション・アーキテクトという、イノベーションの設計者みたいな仕事です。持続可能なサービス、ビジネスモデルというのがアウトプットになります。でも、それはひとりではできないので、企業や大学、自治体に協力してもらいながら、新しいサービスをきちんとビジネスとして回るような形で立ち上げていくのが仕事です。

オープンデータにかかわり始めたのが2012年くらいでした。2013年のG8でオープンデータ憲章が公表されて、G8参加国はデータを公開しましょうという流れになりました。日本政府はそれまであまり積極的に取り組んでなかったのですが、そこからオープンデータ運動の機運が高くなったんです。それで公開されたデータを活用して新しいサービスをつくることにずっと取り組んでいて、「データ✕アイデアで勝負する人々」という本も書きました。

ゲノムデータ保護の課題

― 私はこの方面の世界に詳しくないんですけど、話を聞くにつれ、ものすごい大きな可能性を感じています。

今、一番ホットなのがゲノムデータで、ゲノムシーケンスという人間の遺伝子を分析する価格が、一気に落ちてきているんですよ。その分析費用が、以前は何億円もかかっていたものが、今は1000ドルくらいです。それが数年後には100ドルあたりになるだろうと言われてます。1万円で手に入るのです。

それが何に使われるのかというと、新薬開発や、その人専用の治療、それが可能になってくるんですね。でも、そこで問題になるのが、そのデータは自分そのもので完全な個人情報だし、どう管理すべきかなのです。個人がきちんとアクセス権をコントロールする仕組みをつくっていかなきゃならない。

東富彦

それで、そこにブロックチェーンみたいなものが使われ始めているのです。ブロックスタックという、ブロックチェーンを使ったフレームワークみたいな感じですけど、それを使うと個人がアクセス権のコントロールを完全に握れるので、自分のプロフィール情報に、あの人には見せてもいいけど、この人はお断りっていうようなことができます。

そもそも個人情報を今、匿名化したり、“非識別化して活用しましょう”なんて日本でやっていますけど、アメリカなんかは非識別化しても、いわゆるソーシャルネットワーキングサービスのデータと組み合わせれば、80~90%くらい特定できちゃいます。だから、データの所有者がきちんとコントロールできる仕組みをつくるべきだって何年も前に言ってるんですよね。それが今、ブロックチェーンを使って実現されようとしてるのです。

ブロックチェーンで改竄を防ぐ

― ブロックチェーンと聞くと、どうしてもビットコインが浮かんできて、どこか怪しい印象を持つ人もいると思うのですが、そもそもブロックチェーンってどういう仕組みなんでしょう。ものすごい可能性があることはよくわかるんですけど。

簡単に言うと、基本的に公開型の分散管理ができる台帳みたいなもので、だれでも見られるんだけど、改竄することが非常に難しいシステムです。きのう、ある大学の先生と話をしたのですが、大学の中の文書管理もブロックチェーンを使ったほうがいいんじゃないかという話も出てるそうです。大学の先生はいろんなドキュメントを書きますから、それが改竄されていないことを保証しなきゃならない。それにはブロックチェーンを使ったほうがいいだろうという話です。この前、騒ぎになった役所の中での文書書き換えも、ブロックチェーンを使えば防げるようになります。

また、食品のトレーサビリティというものがあります。例えば、日本からシンガポールへ魚を輸出しました。ところが先方に着いたら魚が腐ってた。当然大問題になるんですが、なぜ、どこで腐ったのかわからない。その対策として、どこからどこに、いつ移動して、どういう保管状態にあったのかという情報を、すべてブロックチェーンに書き込むのです。中にIoTのデバイスとセンサーを入れて、温度を測定、そのデータを自動的にブロックチェーンに書くことによって、この魚はきちんとした手順で、きちんとした温度管理の下、きちんとした日数で届いたと保証できるようにしようということです。

ブロックチェーンはこんな形で食品トレーサビリティにも使われるんですが、通貨に使っているのがビットコインで、文書管理で使おうというのが政府や大学の考えていることですね。みんな仕組みは同じです。

気象データと土壌データから保険ができる!?

― ブロックチェーンとビッグデータを組み合わせたら、世の中が変わっちゃいますよね。もう、そんなところまできてるなんて驚きです。一般の人たちはブロックチェーンとかビッグデータの仕組みはわからなくてもいいのかもしれませんが、もう実際に生活の中に取り込まれているのですね。

今までの住宅保険は、調査員が現地まで行って、壁や柱の状態を見て保険料を決めていたのですが、今はもう衛星の画像を解析して査定するんです。それでコストが下がって、保険料も安くなります。車だって、年齢や走行距離なんかで保険料を決めていたものが、いずれ個人ごとに料金査定するようになります。

― 「獺祭」という日本酒がありますが、今まで職人さんの感覚に頼っていたのを、全部データ化して常に一定品質に保つというやり方をしているそうです。そういうのもビッグデータと言えるのでしょうか。

それは暗黙知を形式知にするという昔からある話で、ちょっと違いますね。ビッグデータは、データそのものからは想像できないようなアウトプットが出てくるわけです。気象データと土壌データを組み合わせて保険ができるとか、そういう世界です。衛星画像から漏水箇所がわかるって、全然結び付かないじゃないですか。

東富彦

オープンデータの世界は何度でもチャレンジできる

― 先日テレビで見たのですが、近畿大学が「宇宙マグロプロジェクト」という衛星を使った調査方法を研究しています。例えばこの情報がベースになって、いろんなところに波及すると考えれば、もともと違う目的で取ったデータがまったく別のものに生かされるってことですよね?

そのマグロのデータを使って、次に何をするかなんです。だから、その集めたデータをとにかく全部出す。オープンデータの世界でも、“何に使うからデータを公開してくれ”というアプローチはしないでほしいと言う人は多いです。何が起こるかわからないのですから。

今、自治体は生活保護費の増大に悩んでいます。それを必要とする人をこれ以上増やさないために、そうなる前に職業訓練や仕事の紹介などの対策をやりたいと思っているのです。そういう人たちをいかに早く見つけるかを、自治体は考えたいし、私たちはつくりたいのです。

そうすれば生活保護を受ける人も減るし、自治体も生活保護費を削減できるし、社会も働き手を得られるし、みんながハッピーになります。これは出来上がった例なんですが、大学や高校の中途退学者候補をいかに早く見つけてフォローし、退学を防ぐかというものです。少子化なので、せっかく入学してもらっても、やめられたら学校も困りますよね。

― どういった課題を解決させたいというのが明確になっていれば、データを使って解決できない問題はなくなりますね。

少なくともチャレンジできる環境にはなりますね。これやりたい⇒ではこのデータとこのデータを組み合わせてやってみよう⇒その結果、失敗したとしてもどこを改良すればいいのかわかれば、また繰り返せます。その繰り返しのコストがほぼかからないんですよ。

材料を使って何かを作るとなると、そのたびにお金がかかりますが、データの場合はほとんどかかりません。アメリカにあるDataRobotという会社が何をやってるかというと、データを入れれば勝手に予測モデルをつくってくれて、提供してくれるんです。目的変数といって、予測したい変数と一緒に、これに関係していると思われるデータを流し込むと、本当に関係するデータだけを選んで、100通りくらいの方法で分析します。その結果から、一番確度の高いものを顧客に提供するのです。

東さんの今後の展開

公共サービスにデータやAIをもっと使うべきだと思っているので、公共分野での新しいサービスをつくっていきたいなと考えています。一か所で公共サービスが成功すれば、自治体はいい意味で横並びなので、どこでも使ってもらえる形になります。そうなれば、さきほどの生活保護や中途退学の問題も広く解決できるようになります。そういったことに取り組んでいきたいと思っています。

東富彦

【略歴】
東富彦(あずまとみひこ)
公益財団法人九州先端科学技術研究所オープンイノベーション・ラボ BODIK担当ディレクター、国際大学グローバル・コミュニケーション・センター 併任研究員、総務省平成30年度地域情報化アドバイザー

大手ICT企業でデータ活用ビジネスの研究に従事。2012年からオープン・ナレッジ・ファウンデーション・ジャパン、オープン・コーポレイツ・ジャパン等でオープンデータの普及を図る。2016年に拠点を福岡に移し、九州・山口圏の全自治体のオープンデータ化を推進する「スマート九州プロジェクト」を開始。2017年、自治体のオープンデータ活動をトータルに支援する「BODIKオープンデータセンター」を開設。「日経ビッグデータ」に多数の記事を執筆。近著に『データ×アイデアで勝負する人々』(日経BP社、2014年10月)。

公益財団法人九州先端科学技術研究所