エンピリカルソシオロジスト

データ分析業務は一過性のブームに終わることなく、広がりそうな昨今です。

考えてみれば、ITの世界においてデータ分析業務がこのタイミングで拡大するのは当然です。もともと企業のIT投資はまず既存業務をIT機器へ置き換えることから始まりましたが、そのファーストステージとも言える投資は一巡し、今度はIT化のお陰で蓄積されたデータを活用するのがセカンドステージで、それが今なのだと考えれば現状はとても自然に映ります。

ではデータ分析は、なんのためにやるのか。

それは可視化、最適化、創造、の3つだと思います。

データを使って今まで見えてなかったものを見えるようにする可視化がまず最初。それができたら既存の仕事を効率化してコスト削減や売上増を狙う最適化を行うのが次に来ます。そして既存の仕事だけでなく新しい価値ある仕事を生み出す創造までできるようになると究極のデータ分析といえるでしょう。

可視化、最適化、創造、のいずれにしても何らかの仮説を立てて実践し結果を観測してフィードバックするというPDCAのループをぐるぐる回すのが王道になりますが、その際に仮設を立てるところが割りとアート的というか体系だった方法がまだ整備されつくしてないと思います。

仮説をたてる部分は恣意性があるので、ビジネス的あるいは社内政治的な諸々の事情にさらされて決まることが多いと思います。

データ分析業務の教科書的な資料の多くでも、まず分析の目的を明確にせよ、とあります。ゴールの設定イコール仮説の立案です。

つまり何が言いたいかというと、データサイエンスといいつつ仮説を立てるところは恣意性をさけられないし、そもそもデータ分析業務において扱うデータの多くが物理現象のような強い再現性をもちにくいデータであることが多いため、データ分析業務というのは社会学をちょっとエンピリカルにした程度の「サイエンス性」しか原理的に持ち得ないと思うわけです。

なので、データサイエンティストっていうのやめて、エンピリカルソシオロジストって呼びませんか?