洞察力と思考力

昼食から帰って自分のブログ読み返してハッとした。 「洞察」と「思考」とは、人間の精神活動として別物だと思っておいたほうがいい、という発見があったので今日は人生の満足度高い。僕は洞察力がすごいあるのに、思考力があまりない。2014-04-24 13:20:44 …

やっぱり僕の文章は、僕の人格とシンクロしている

僕の文章は、 技巧に長けていて、 それなりに知識体系が広く深く、 ユニークな視点と鋭い洞察がある。 しかし思考そのものは浅く、 経験談よりも批評指向であり、 少々品格に欠けるところもある。 文章を書くと、人格が丸裸になる。僕にとって文章は、自分を…

独創性における「型」の重要性について

昨夜は久しぶりに新書を一気読みしました。お笑い芸人に関するメディア記事やインタビューをつなぎ合わせて、芸人たちの素性を描きつつ視聴者目線での芸人の明確な位置づけを語る、といった内容の本です。さらっと読めて面白い。有吉弘行のツイッターのフォ…

磯島拓矢著「言葉の技術」を読んだ

広告テクノロジーの仕事をしてるのだから広告について勉強しようと思って磯島拓矢著「言葉の技術」を読みました。筆者は電通のクリエイティブディレクターでコピーライティングのプロ。本質的なことしか書いてないので90分くらいでさらっと読めて、すごく…

モードの切り替え

前エントリのつづき。 経営者モード(売れることを必死に考えて、最短コースで行動する。) 技術者モード(作ることを何よりも優先し、最速で製品を完成させる。) 研究者モード(世の中に今までなかった新しいことを実現可能にする。) これを同時にやると…

ビジネスうぜぇ。俺は好きなものを作るぜ。

一流というほどの技術力はないかもしれないけど、それなりにモノは作れるぞって自信をもっているエンジニアが一人で起業したケースで、受託開発を離れて自社製品の開発を進めようとしたときにありがちだと思われる話をします。 僕は起業する前は、自分はとて…

「機械学習ハッカソン!」を開催しました。

4/19(土)に機械学習ハッカソンというイベントを開催しました。参加されたかたの感想エントリ 機械学習ハッカソンに行ってきました。 (@aki_n1wa さん) 機械学習ハッカソンに参加してきた (@_TRIP_DANCER さん) 当日の雰囲気(会場協力:秋葉原アンダーグラン…

RBM学習結果の可視化

MNIST文字画像データを与えて、エッジの重みを可視化するというのをやってみました。自分で書いたjuliaのコードは学習がうまくいかなかったので、「ゆるふわ Restricted Boltzmann Machine」のコードでやってみました。 実行結果 (step1) (step2) (step5) (s…

近況2

どうすれば興味あることを全て同時並行で成し遂げられるんだろう。 他人の成果と自分の成果を比べない 自分が実現できそうなことをやる 全体像が見えないときはちょっとやってみる とかだろうか。知的生産におけるメタスキルをモノにしたい。

近況

安宅和人著「イシューからはじめよ」が最近のバイブル 実作業する前に「意味のあるゴール」を決める習慣づけ アドテク Rでモデリング CTR/CVR予測 ブランド・カテゴリ選好度の数値化 (純広告2.0的な)大手メディア向けSSP オウンドメディアCMSとネイティブ…

I hate those who involve in "passive arguments", but ...

たまに見かける嫌いな人のタイプ。こちらが何か具体的な例を挙げると、「それって端的にいうとどういうことです?」と具体例の吟味をせずに抽象論をリクエスト。逆にこちらが抽象的な命題を持ち出すと「たとえば?」とすかさず具体例の提示をリクエスト。こ…

ブランド選好度のベイズ推定(ざっくり)

ブランディングの数値化に向けてWinBUGSを使ったtoy modelを作ってみた。ECサイトの商品購入ログからユーザのブランド選好度を確率分布として出す、というもの。RとWinBUGSのコード一式はChiral's Gistに置いてあります。 モデル化 商品閲覧/購入ログがN個あ…

出した実績や成果以上に知識とスキルがあることは恥ずかしい

僕は勉強することがすごく好きなので時間があるとつい色んなものを学んでしまう。それで人生がとても充実するし、なるべく業務に遠からぬ分野を学ぼうとしているので精神的な安定にもつながっている。しかし、今日オフィスまでの道を歩きながら、ふと思った…

「ソフトウェアを作るのが意外と難しい」理由を再説明してみる

トラックバック&感想。 ソフトウェアを作るのは、意外と難しい これ共感しますね。このテーマ、僕も一家言ぶちたい願望があるので、ちょっと僕の言葉で言い換えてみます。ソフトウェア以外にも顧客の注文なり社会的な要請なりを受けて創造されるものってあ…

統計的学習理論(1): フィッシャー情報量とクラメールラオ下限と最尤法

勉強したことメモ。数式を使わずに書く。また、行間をスキップせずに、多少くどいかもしれないくらいにきっちり順を追って説明を書いたので長いけどわかりやすくなっているはず。第一回はベイズの手前まで、最尤法のあたりまでの話をする。 推定量 データを…

身体を軽視しすぎてる現代人

今日もオフィスで目覚めましたー!起き抜けにポワワワンとブログネタ浮かんだんで書きますね。 「俺、努力しようと思ってるんだけど出来ないんだよ。。」 「彼女を信じてるし確かに気持ちは僕に向いてるのにしょっちゅう浮気するのナゼ??」 「あいつ貸した…

データ拡大はギブスサンプリングと比べて何が嬉しいのか

照井伸彦著「ベイズモデリングによるマーケティングデータ分析」をざっくりと読み終わりました。感想としては 多変量正規分布とベイズ推定、SURで誤差をつなぐ、MCMCはGSとM-H、階層ベイズをブランド選好に適用する方法、ロジットは積分結果が簡単、プロビッ…

ブランディングの数値化について

slideshareを公開しました。PDFはこちらからダウンロード可能です。再配布自由です。 ブランディング指標の数値化について from Masayuki Isobe

研究とビジネスの共通メソドロジー

最近自分の「興味ドリブン」な生活がまずいと思い、やり方を変えるヒントを得ようとして3年ほど前に購入して一度読んだ安宅和人著「イシューから始めよ」を再読した。それで思ったこと。この本を要約すると、つまり研究やビジネスにおいて成果を出すには、意…

複数のカテゴリ変数同士の相関を一気に可視化する方法

複数のカテゴリ変数があって、それらの相関をみたいときクラメールの連関係数というのが便利です。カテゴリ変数の間の相関をまとめた変数をざっくり取り出したいときは因子分析というのを使うことが多いと思いますが、ここでのテーマはその因子分析とかを適…

VCAの出力はなぜ直感的に期待される多項式にならないのか

昨年NIPSベストペーパーで話題になったVCAの論文読みメモです。デンソーアイティラボラトリの塚原氏が試していた件を初めとして、幾人か実装してブログを書かれているが、なぜ単純な円にガウスノイズを乗せた程度のグラフで円の方程式がパッと出てこないのか…

pHomパッケージでドーナッツの穴を数えてみた

CRANに登録されているpersistent homologyを計算できるpHomパッケージで3次元トーラスの穴を数えてみました。ソースはこちら。 データ生成 まず与える人工データの生成ですが、極座標表示したときの回転パラメータ2つでそれぞれ20間隔にして20x20の400点作り…

ホモロジーとは何か

xiangzeさんのブログ記事に凄く興味をもって、20代の頃に取り組んで挫折した代数トポロジーについてグーグル先生に教わった。 ホモロジー群の嬉しさ(プログラマ目線) 図形が「同じ」であることを数学的に定義する方法として、合同や相似というのは中学校で…

起業家と開発者と研究者

起業家の評価はどれだけ新しい市場を作り出せるかで決まる。ある起業家が新しい知や物を全く生み出していなくても、新しい顧客、新しい売り方、新しい買い方を生み出せるならばその起業家は評価される。逆にどんなに新しい商品やサービスを生み出せても市場…

社名を変更しました

アドファイブ株式会社は、4/1日付けでAD5(エーディーファイブ)株式会社に社名を変更致しましたのでお知らせいたします。近年、データに基づいたマーケティングがますます重要になってきており、当社は設立来約1年半にわたってWeb広告関連事業に特化して取り…

RBM in Julia

一昨日Rで書いたRBMを使ってdeep learning tutorialで紹介されているMNIST手書き文字画像(観測ノード数はピクセル数と同じ784、訓練データが60000画像)のデータを食わせてみたら激しく遅いのでC++より書きやすくて実行効率もいいとうたっているJuliaで書き…

「私がJuliaを推す理由」(翻訳)

Juliaについて書かれた海外のブログ記事でとても共感したものがあったのでブログ主に無断で翻訳したものを掲載します。(もし問題ありましたらご連絡ください。)このブログの著者はEvan Miller氏というソフトウェア開発者でWizardというかなりイケてそうな…

最近の興味

ありすぎるのでまとめておく アドテクへの機械学習の応用 これは会社を作ったのだからなんとか製品化できるものを見いだしたいと思っている。カルマンフィルタや粒子フィルタ、LDAやDeeplearnig等を研究している。バンディットアルゴリズムやベイジアンネッ…

Restricted Boltzmann Machineを実装してみた

R言語で実装してみました。特にパッケージは使ってないのでコピペすれば動くと思います。このプログラムは隠れノード数やCD-kのkや更新ステップのηや収束条件のパラメータ等を変えて試すことが出来ます。 また学習後のRBMを使ってreconstruct(後述)したり…

ロジットとプロビットの使い分け

出力変数(被説明変数)がYes/Noみたいな2値で表されるようなモデルを学習させたい場合についてググるとロジスティック回帰とかプロビット回帰とか出てきて、「どうやらロジスティック回帰を使うのが定石っぽいけど、プロビットっていう良くわからないのが…

SciPyで最適化

Deep learningのRBMやAutoEncoderの数式は分かったので、Pythonで実装してみようと思ってSciPyから始めることにします。非線形最適化と3Dプロットを試してみました。ソースコード。緑の点が初期値、赤の点が最適化結果。緑の4点のぶんだけ最適化関数を試し…

粒子フィルタを実装してみた

カルマンフィルターを試したので、次のステップとして粒子フィルタをR言語で実装してみました。ソースはChiral's Gistに置いてあります。 粒子フィルタとは? 状態空間モデルで、隠れ状態の遷移と観測モデルのいずれもが非線形な場合に使える状態推定アルゴ…

カルマンフィルタのアドテクへの応用(実践編)

前回のつづきです。いくつか理論の補正*1 実験はR言語で行いました。ソース及びデータの一式はChiral's Gistに置いてあります。 具体的な問題設定 ある市場において、商品カテゴリ1,2があり、A社とB社が競合してるとします。A社は1,2両方のカテゴリの…

カルマンフィルタのアドテクへの応用(理論編)

カルマンフィルタという数理手法がロケットの姿勢制御等で良く使われています。これをアドテクに応用できそうに思うのでシェアしてみます。 カルマンフィルタと関連手法(知ってる人は飛ばして次へ) カルマンフィルタは一言でいうと「連続値の隠れ変数につ…

行列計算ライブラリの簡易ベンチマーク

ClojureとF#は行列計算をネイティブコードで実行するライブラリがあるのでそれを使うとどのくらい速いのかをテストしてみました。3000x3000で要素は[0,1]区間の一様乱数で埋め尽くした行列Mを作ってMとMの逆行列を掛けてトレースを計算する(答えは3000にな…

BootcampでWindowsのブラウザの解像度がおかしいとき

ブラウザのショートカットアイコンを右クリックして「互換性」タブ→「高DPI設定では画面のスケーリングを無効にする」をチェック。(ググっても出てこなくて1時間以上ハマったのでインターネットでシェアしときます)

SRM613

R1372でDivに参戦。 Easy x軸上のN匹の猫が左右にX回移動したときの移動後の両端の猫の差を求める問題。 プログラミングコンテストチャレンジブックに載ってるアリの問題と大体同じだけど自分で考えてサブミットした答えは全然間違っていた。500人以上も解い…

メタ・ビッグデータ

すごく抽象的だけど面白い話。いわゆるデータ爆発の時代に、データをどう管理するかはIT産業における大きな問題です。Hadoopをはじめとするビッグデータの蓄積保存と分析のためのツールも普及が進んでいますが、いっぽうでデータの検索や管理についてはまだ…

HaskellとClojureとF#で書き比べ

最近ClojureとF#が気になってしょうがないので、最近楽しませてもらってるPython練習コミュニティサイトCheckiOに掲載されている問題の一つ、words_finder をHaskellとClojureとF#で書き比べてみた。同じ問題の同じアルゴリズムでの解答をそれぞれの言語で解…

早熟と大器晩成について

トラックバック&感想 最初の3年で仕事人生の大半が決まる説 意識高い(笑)と小馬鹿にしてる人に哀れみを感じる。 こういう話を読んで思うのは、プロ将棋の世界のことだ。トップ棋士の羽生さんは14歳でプロになり、以後ずっとトップを維持している。仮にそ…

プログラミング言語の使いわけ

私は色んなプログラミング言語を触るのが病的*1に好きで、どの言語をどういう場面で使うのが良いのか凄く興味があります。そこで、今の私の知識範囲でのそれぞれのプログラミング言語の使いどころを(自分用の整理もかねて)書いてみます。 C/C++ - C=OSや…

SRM612

R1288でDivision1に参戦。最近CheckiOやコンサルの仕事などでPythonをよく使っているのでPythonで参戦。JavaだとKawigiEditというプラグインが便利なんだけどPythonはGreedというのが便利そうなのでそれを入れて開始前に2問くらい解いてた。 Easy 顔文字1個…

CheckiOをクリアした

CheckiOというPythonのコーディング練習サイトを2月中旬くらいから始めて少しずつ進めていたが今日とりあえずマップ上の問題までは*1全てクリアした。システム環境周りとかの面倒くさいところがないパズル的な問題が多いのでゲーム感覚で楽しく練習できるの…

pyenvでanacondaと通常pythonを切り替える

以前このブログでも紹介したAnacondaをMacで使うとき、Systemにもとから入ってるpythonやbrewで入れたpython等とライブラリパスなどがぶつかって使いづらいときがあります。そこでpyenvを入れてみました。ググるとやり方は出てきますが一応ここでも。 # brew…

SRM611

前回の610が仕事で出来なかったので3週間ぶりくらいの参加。R1299。 Easy 元の集合に最小公倍数をくわえて出来る集合が等しいかどうかをチェックする問題。最初問題を読み間違えて最小公倍数が等しいかどうかを調べるのだと思ってコーディングしたら集合が等…

苦労と成功の関係とか人生とか

最近危機感が薄れているので、自分が抱える「社会への恨み」を思い出して発奮しようとツイートしたら、オフィス仲間からブログエントリを紹介された。世の中で一番危険なのは、「自分はこんなに辛い思いをしているのだから、成功するしかない。」という強迫…

SRM609

レーティング1215でDiv1に参戦。 Easy 文字列処理。括弧のネストが最長になる長さを求める。左右からそれぞれ数えていってぶつかったときのカウント数を2倍するだけ。でも10分くらいかかった。 Medium K色のボールたちをパッケージに分ける問題。1パッケ…

プラットフォームとメタビジネス

今日は「水平分業」というテーマについてひたすら書いてみます。この記事は本当に面白かった。 IoT本命Cerevoのモノづくり--ニッチを標的に世界で作る・売る方法EMS(electronics manufacturing service)業者がたくさん出来ていたり、AmazonでWeb店舗・集客か…

Boxenで入れたMySQLにJDBCからアクセス

2時間半以上ハマったのでメモ。 BoxenでMySQLをインストールすると、homebrewで入れるものとの衝突を避けてデフォルトポートを13306にしてくれる。なのでローカルで開発している場合、DB接続の設定を気をつける必要がある。 JDBC経由でlocalhostのMySQLに接…

核軍縮とシミュレーション

(こういうネタはニーズがあるのか分からないがちょっと書いてみる)1940年頃、アメリカではマンハッタン計画が始動した。当時は第二次世界大戦の真っ只中ではあったが既に事実上決着がついていることを知っていたアメリカは大戦後の世界のパワーバラン…