読者です 読者をやめる 読者になる 読者になる

「機械学習ハッカソン!」を開催しました。

4/19(土)に機械学習ハッカソンというイベントを開催しました。

参加されたかたの感想エントリ

当日の雰囲気(会場協力:秋葉原アンダーグランド)

背景

機械学習の手法は学術研究の世界でどんどん進歩していてビジネスの世界でも応用されはじめていますが、アルゴリズムを実社会の価値にどう結び付けるかはまだまだ試行錯誤な面が大きいと思います。

そこで体系化された広い知識基盤を必要とするものの代名詞ともいえる「機械学習」と、とにかく手を動かしてすばやく結果を出すのを競うことの代名詞とも呼べる「ハッカソン」を合わせたイベントがあったらいいなと思いました。@yamakatsuさんに背中をおしてもらったこともあって、自分で企画開催することにしました。

ハッカソンの内容

compassで告知したところ、800UUくらいの人がイベントページを見てくださり、30名ほどの方の応募がありました。当日の参加者は10名でした。全く聞いたことのないイベントでも参加してもらえるものだな、と感じます。

11時から17時まで、めいめいでテーマを決めて取り組む、条件としては時間内に人前でプレゼンできる何かをやるというざっくりとした内容だったので参加されたかたはちょっとやりにくかったかもしれません。

各チームがやったことは以下のとおりでした。

  • 自作RBMで学習させた重みの可視化
  • 引き合いのメールログから案件内容を抽出
  • Kaggleの問題のデータの前処理
  • sklearnのサンプルの写経
  • SCWの実装
  • FX自動トレードアルゴリズムサーベイ
  • Rのサンプルの写経(titanicデータ)
  • titanicデータでRのnnet,svm,kpcaを試す
  • ナイーブベイズSNSの投稿エントリを自動タグづけ
  • サザエさんのじゃんけんの予測モデル

優勝は家志さんの「サザエさんじゃんけん予測」、準優勝はいしたーさん( ‏@sonicair )の「SCWの実装」、3位は「Kaggleデータの前処理」をやった秋庭さん( @aki_n1wa )でした。(ちなみに僕がやったのは「RBMの重みの可視化」で4位でした)

全体的に最初のうちは和気あいあいとしていて、17時締切直前はみんな手を動かし続けてる、というハッカソン特有の雰囲気で楽しかったです。

手法の名前は知っているが、いつどういう風に使えるかがよくわからないという人が多かったように思います。高額のデータサイエンティスト養成講座にいかずとも、こうしたイベントに定期的に参加してるだけでそれなりに学べちゃう、また有識者は自身の知識体系を再確認する場として機能したらよいなと思います。

懇親会

ハッカソン後、5人くらいでピザ注文して機械学習のビジネス活用や今後のハッカソンイベントの進め方などについての話をしました。様子を@aki_n1wa さんが詳しく書かれているのでそちらをご覧いただくのが良いと思います。

@aki_n1wa さんや@_TRIP_DANCERさんのエントリにもありますが、アルゴリズム研究の世界とエンジニアリングの世界でギャップがまずあり、さらにプロダクト・サービスについてもベンダーとクライアントのギャップがあり、ということで機械学習を実際に応用してビジネスをしようとすると「人の壁」がかなりあると思います。なのでこうした巷のイベントというレベルで少しでもそういうギャップを埋められたらいいなと思います。

今後の予定

まず第一回ということでざっくりとテーマを決めずにやりましたが、参加されたかたに伺って思った課題として

というのが浮かび上がりました。

そこで、

  • 前者:Kaggleや実際の企業から借り受けたデータでテーマを決めて一同に会して分析に取り組むハッカソン
  • 後者:実装するアルゴリズムを一つ決めて、まず詳しい人が解説をしたのち各自実装し、後日相互レビュー

というイベントをやれたらいいなと思います。

というわけで、こうしたイベントを月1,2回のペースで続けていきたいと思うので、引き続きご参加・ご協力よろしくお願いします!