2013年7月6日土曜日

データサイエンティストだけでは「ビッグデータ」はどうにもならないと感じたたった1つの理由

日経BPから出版された「データサイエンティスト完全ガイド」という本を読んだ。



http://www.amazon.co.jp/dp/4822230422


データサイエンティストがセクシー(魅力的)な職業と叫ばれて、hadoopが持て囃されて、もう2年ほど経とうとしているのではないか。

それでは、具体的に何が変わったのかと改めて問いたい。どの業界で、どのイノベーションが起きて、パイはどれくらい大きくなって、利益はどれくらい生まれたのか

本当のところ、西内啓さんが儲かったぐらいではないか。


私自身、その荒波に現在揉まれているのだが、「ビッグデータ」というバズワードをしきりに叫んでいるベンダー企業を見ながら、お前らとりあえず数年前の「CRMがマーケティングを変える」と言った責任取れと、呪いを込めて藁人形に五寸釘打っている毎日だと言ってもいい。


結局、この「ビッグデータ」、そしてそれを操る錬金術師(データサイエンティスト)は、クラウドのようにある種オーソドックスになるのだろうが、今期待しているほどには盛り上がらず、陳腐化してしまうと考えている。


なぜなら、次のたった1つの理由が、データサイエンティストの「陳腐化」を急かしている、もっと言えば「意外と使えないね」という声を増やしていると感じているからだ。



「顧客の創造」に貢献するマーケティング施策のために、材料として「ビッグデータ」を扱える料理人が、データサイエンティストとは思えない。



改めてだが、企業の目的とは「顧客の創造」にあるはずだ。多少、ドラッカーの影響を受けている私だが、これこそ企業の本質だと思っている。

企業は顧客無くては生きていけない存在だ。顧客を創造し続けない限り、企業はやがて消滅してしまう

昨今のアドテク業界で言えば、RTB/DSPが良い例だ。広告主の不満を嗅ぎ分け、見事に「顧客化」に成功した。

そして、「顧客を創造」するためには、マーケティングが欠かせないだろう。多少、簡略化している部分もあるだろうが、私はマーケティングを「顧客に買いたいと思わせる手法」だと理解している。

商品を知らない人間に、製品に興味を持って貰い、企業にとっての顧客とすることがマーケティングだと理解している

# ちなみに、製品に対する興味を、私は「イノベーション」だと理解している。


つまり、手法としてのマーケティングの1つに、「ビッグデータ」という選択肢が1つ増えただけですよね?という前提に私は立っているし、その前提のまま話を続ける。



ところで、私の知り合いである統計の専門家が次のように言っていた。


「ビッグデータ」と統計の相性が良い理由は簡単。今まで統計の世界は、全数のデータ群に対して幾つかピックアップしたものを分析していた。しかし、hadoopなどのツールを使うことでピックアップするのではなく、その全数データそのものを分析できるようになった。これが理由だ。

例えば視聴率も日本全国の家の視聴率では無い。あくまでサンプル数nの中の話でしか無い。サンプル抽出したつもりでも、もしかしたらその中に偏りがあるかもしれない。しかし、ビッグデータはその心配を無くしてくれる。

言い方を変えれば、今のところ、それ以外に「ビッグデータ」の使い道は見つかっていないんじゃないか。

金融の世界で使われていると言っても、基盤が強固になって、予想の精度が上がったに過ぎないだろう。


いや違う!という人がいれば、ぜひ挙手して頂きたいし、その具体的な事例を教えて欲しいところだ。

実際、データサイエンティスト完全ガイドにも、上記を説明を大幅に上回るような話は出てこなかったという印象を持っている。

あくまで「改善」という業務の中で、今までいた「分析する人」に、新たにデータサイエンティストという役職が付いただけじゃない?というのが私の理解だ



そもそも、この「改善」には3つのフローが必要だと理解している。


①データを集める(情報システム系の人担当)
②集めた結果をもとに分析する(分析系の人担当)
③分析した結果をもとに次回施策を練る(マーケティング系の人担当)


「ビッグデータ」が非構造化データも扱えることを売りにしているが、実際に分析する人が、そうした非構造化されたデータを分析できるかと言えば、絶対にできない。これは賭けてもいい。なぜならそもそも統計の世界が、それを前提にしていないのだから。カテゴリデータ、あるいは量的データは、いずれも構造化されている前提になっているはずだ。

つまり、①の段階で、非構造化データをhadoopに入れてしまい、ゴリゴリと構造化データに整列し直す必要がある。

では、それができるデータサイエンティストって日本に何人いるの?というのが正直な感想である。hadoopの勉強会に来る人の割合で見れば、だいたい1~2%もいれば良いほうだ。


もっと言えば、いくらデータを集め、分析したとしても、そのアウトプットが次の番であるマーケティング系の人のインプットにならなければ意味が無い。

幾ら扱えるデータ量の分母が増えたとしても、マーケッターのインサイトに繋がらないなら、それはゴミデータでしか無い。


つまり、①担当、②担当、③担当が緊密に話し合い、あーでもないこーでもないとワイガヤ会議をしながら最終的に次回のマーケティング施策に落とし込むというのが恐らくはあるべき姿であって、本来は「ビッグデータ」というのはチームで対応しなければいけないのに、データサイエンティストだけに注目しても仕方が無い、という話だ。

データサイエンティストには、情シスの頭も無いし、マーケティングの頭の無いんだから(それは言い過ぎかもしれないが殆どの人が専門家では無い筈だ)、その人だけに期待して、その人だけに任せたとしても、以前のようにチームでやっていた内容に比較したらそれは劣るし、周囲の人も「たいしたことないな」と思うだろう



「顧客の創造」に貢献するマーケティング施策のために、材料として「ビッグデータ」を扱える料理人は、情シス、データサイエンティスト、マーケッターで構成されたチームである。



これが今のところの結論だ。一刻も早く、経営層はそれを理解したうえで、部署を横断した組織を創るべきだと思う

特にアドテク業界は、ベムさん風に表現すると広告テクノロジーで何でもイノベーションが可能と過信した前科があるので、データサイエンティストにのみ頼ろうとする風潮が強すぎやしないだろうか?


大切なのはチームであり、もっと言えばそのチームを束ねられるマネジメント層なのだが、そうした層の教育を怠り、中途採用で急場を凌ごうとするのも、そろそろ止めなければいけない。

リスティングやアフィリエイトにばかり広告費を投下して、純広やDSPなどで認知度を上げるように、中途ばかりに頼らず、社内で育てる体制の構築こそ急務だ。

しかし、それこそアドテク会社が、外で言っている「育成と刈取の重要性」を、中では刈取一本に絞っているのも節操無い話だ。