DMPとデータマイニング

毎日ブログ書く宣言から2日目。

今日のテーマは「DMPとデータマイニング」。DMPとは昨今アドテクの世界で普及が進みまくっているデータマネジメントプラットフォームのことで、つまり広告を届ける相手をシステム的に制御するために、相手について知っている情報を管理しておくシステムのことだ。

イントロ

データマイニングのビジネス活用全般にいえることだけど、データマイニングは手段として(ツールとしての)豊富さはあるけど、どうやって活用するかのノウハウが少ない。またデータを蓄積する手段は豊富にあり、データを活用して「こんなことが出来たらいいな、あるいは、出来るかもしれないな」という漠然とした目標もあるけれど、では具体的にデータをどう処理したらその目標にたどり着けるかがいつも課題になる。

つまり、調理器具が一揃いあって、性能のいい大型冷蔵庫があって、そこに材料をいっぱい詰め込むことも出来ていて、さらに「なんとなく中華が食べたい」という要望もある。それなのに肝心のレシピがないし、シェフを連れてきて調理してもらおうとしても、そのシェフの数が圧倒的に足りてない、というのが現状だと思う。

そう考えるとDMPは、レシピのない調理場における冷蔵庫と調理器具みたいなものだ。

レシピには共通パターンがある

調理のたとえを持ち出したのでそれを続けると、例えば「鰹節と昆布でだしを取る」とか「醤油・砂糖・酒・みりんで煮込む」といった家庭でも日常的に行えるようなものやスキルのある調理人が行う「素揚げする」「バーナーであぶる」といったものまで、レシピには部分的なパターンがある。それらのパターンは

  • 調理手順の最初・途中・最後、と使われる段階に差がある
  • 家庭料理でよく使う手法とレストランで使われる手法に差がある
  • 料理のジャンルごとにパターンの組み合わせや頻度が決まっている

等々の性質がある。

ではデータ活用を調理のレシピになぞらえてみたとき、そういう部分的なパターンとは何か?また、調理レシピのパターンに見られた上記の色々の性質に相当するものは何だろうか?

調理レシピのパターンの起源

そもそも調理レシピの諸々のパターンはどうやって発生したのだろうか。「ダシを取る」という概念がまだ明確化されていない時代には、凄腕の調理人は直観で無意識にダシを取っていたんだろうか。つまり「おいしい料理を作る」という目標のみを意識して試行錯誤を重ねる過程で、勝手に部分的なパターンが自然発生し、繰り返し現れるパターンが調理人の世界で定着したのだろうか?これはそれなりに妥当な歴史観ではある。

この歴史観をデータ分析に当てはめると、単に現時点では「共通パターンが生まれるほどの成功事例が社会的に蓄積されていない」ということになる。しかしそれでは時が解決するのを待つのではあまり面白くない。

そこで、別の歴史観を考えてみる。レシピのパターンは最終的な料理作りのみを意識して作業する過程で自然発生したのではなく、パターンごとに意識的に作られたと考えてみることにする。つまりそれぞれパターンを「加工食品」を作るプロセスとして見るということになる。「ダシ」という加工食品、「xxの素揚げ」という加工食品、「バーナーで焼き目をつけたxx」という加工食品、などなど。

加工食品にニーズがあるのは、「それ単体で食べられる」か「料理の材料として使える」からだ。だから、「単体で食べておいしい」という人々の認識や、「これはこういう料理に使える」「これとこれを組み合わせるとこういう味になる」という認識があれば、加工食品は加工食品として単体でニーズが生まれる。

加工済みデータの保存、鮮度の管理

調理のたとえが続いたが、データ分析の話に戻して考えると、データマイニングのノウハウをレシピ化するにあたって「加工データ」を意識することが重要だと思う。そして加工データがそれ単体で価値を持つためには、それ単体での活用が見えることか、あるいは別の「活用が見えているデータ」の材料となることが見える、という活用者の認識が重要だ。また、鮮度管理も重要になってくる。データの種類によって賞味期限が意識されるべきだ。また醤油や味噌などの市販の加工食品になぞらえると、広く一般的に活用が見込まれて大規模生産でスケールメリットが活かせる種類の加工データというジャンルも、活用者の認識として定着している必要がある。

課題は「文化醸成」

では加工データ単体での活用や、加工データを組み合わせてより上位のデータを生み出す方法が、使う側の認識として定着するにはどうすれば良いだろうか?醤油や味噌、カツオダシに相当する品目はどうやったら生み出せるだろう?それはどうやって「文化を作る」かという文化振興の問題だと思う。文化を生むには誰かが作った加工データを他の誰かが真似して自分も同じ加工をしてみたり、加工データを組み合わせてより上位の加工データを作りさせるようにしたり、加工データの「品目名」を付けたり、加工データの「組み合わせ方法に名前」をつけたり、組み合わせの方法をレシピ集として蓄積したり、そういうことがたやすく出来る環境が文化を醸成するのだと思う。

そう考えると、次世代のDMPに必要とされる機能は、そうした文化が生まれる環境をシステム的にお膳立てするようなものになりそうだ。つまり、コラボレーションを促進したり、下位の加工データを組み合わせて上位の加工データを作れたり、データの品目ごとに鮮度を管理したり、品目ごとに組み合わせ方をレシピ化したり、「品目や組み合わせ方に名前を付け」られて、「別々の名前」で呼んでいる似た品目同士の「名前を統一」したり、それに合わせてレシピ集のほうもある程度追随して自動編集してくれたり、そういう機能がデータ加工の文化を醸成し、次世代のデータマイニングビジネスを可能にしてくれると思う。

というわけで

また明日。