通信講座「データサイエンティスト」 を妄想してみる

毎日ブログ書く宣言から9日目。

今日のテーマは誰でも通信教育を受けるだけでデータサイエンティストになれちゃう「通信講座『データサイエンティスト』」がもしあったら、です。自分が受講者だったら、どんな教材でどういうインストラクションを受けたいか、というユーザの視点で妄想します。

テキスト:理論編

印刷物の教科書は欲しいです。講座を受講し終わった後もその教科書を実務に持ち込んで繰り返し参照できるようなものが良いです。基本となる数式やアルゴリズムは概要説明とともに最初に書かれていて、実務上の典型的な適用例がいくつも掲載されている感じでしょうか。そんな風に手法/アルゴリズム別に分類する、いわゆるリファレンスマニュアルのような編集方法がまず考えられますが、よくプログラミング書籍である「逆引き辞典」のような適用シーンで分類する編集方法も考えられます。そういう手法別/適用シーン別のテキストのほかに、1回のデータ分析・モデリングのプロジェクトをどうやって進めるかを学べるテキストも欲しいところです。お客さんにヒヤリングして要件を洗い出し、ゴールを決めて、データを集めorデータを預かり、分析ツール等に掛けるための前処理を行い、分析ツールに掛けて、結果を評価してレポートにまとめたり具体的な経営上の施策提案を行ったりする、という一連のプロセスについての概要と、各フェーズでの実務上のノウハウや考慮すべきポイントなどを学べると良いです。さらに、データ分析のプロジェクト管理(予算見積もりやスケジュール管理等)についても、既存のソフトウェア開発プロジェクトの管理方法とはまた違ったやり方が必要になるでしょうから、そのノウハウもテキスト化されててほしいところです。

テキスト:実践編

ここまでの内容は理論編のようなテキストになると思いますが、実習編/演習編に相当するテキストも欲しいです。実習編では理論編で出てきた内容に合わせて、個々のデータ分析手法ごとに演習をするものと、様々なデータ分析プロジェクト案件をケーススタディとして演習するものの、2つのパターンがあるとよさそうです。

では演習問題を解いたときの、採点はどうすればよいでしょうか。分析案件によって、適用すべき手法が明確に限定される場合は正解が一つに決まるので機械的に採点できますが、選ぶ手法において分析者の裁量が大きそうな案件だったり、最終報告の仕方によってクライアントからみたパフォーマンス評価が大きく分かれそうな案件だったりすると、採点は難しくなります。とりあえず実務に入る前の研修レベルの教材でいいということなら、適用手法が明確に決まるようなケーススタディだけで十分でしょう。そういった比較的簡単なパターンにしぼったとしても、なぜその手法を選び、なぜそのゴール設定を選んだのかを実例を通して学べるようになっていると、後々も応用が利きそうです。

ビデオ教材

教材は印刷物としてのテキストだけでなく、ビデオ教材もあると良いと思います。ビデオでのインストラクションに向いてるのは、分析ツールを実際に動かすとか、ツールが出力した表やグラフを見ながらどこに着目してどう解釈するかといった、ビジュアルが重要なところでしょう。特に結果の解釈は、分析者の話し方やトーンなどの微妙なニュアンスがとても重要なところなので、ビデオ教材に向いてそうです。もう一つ、クライアントに対して分析結果を報告する際のプレゼンテーションについてもビデオ教材が欲しいところです。いずれのビデオも、テキスト教材のアルゴリズム適用実習やケーススタディ演習に沿った形で作られているべきです。

Web教材

演習問題で使う疑似データをダウンロードしたり、参考となるツールやライブラリのリンク集などはWebに掲載必須として、さらに演習問題を解いた後に「お手本」となるデータモデルや分析レポートを参照できるようにもなっていてほしいです。自分で試行錯誤したあとで、経験豊富な人のアウトプットを参考にするというのは非常に力が付くと思います。

期間とカリキュラム

普通の通信教育に合わせるとしたら3か月が妥当です。それは月〜金に1時間ずつ、または週末に5時間くらいのペースで、全12週=60時間くらいの分量になります。カリキュラムは例えば

  • 最初の週は概要編、最後の週はまとめ編に充てる→本体は10週間
  • ケーススタディと手法別の演習で半々くらいに配分→それぞれ5週間(25時間)ずつ
  • 手法別のカリキュラムは例えば「クラスタリング」「クラス分類」「回帰」「時系列」「異常検知」とか
  • ケーススタディのカリキュラムは「ソーシャルゲームの運営改善」「ECサイトの各種最適化」「ターゲティング広告の精度向上」「超巨大データベースの運用管理」「CRMデータからの経営KPIダッシュボード開発」とか

という案が挙げられます。

というわけで

まず基礎となる部分はすでにある程度体系があるように思うので、通信講座は実現可能だと思います。

ではまた明日。