Perl

リバースプロキシ経由でDancerを動かす方法

VPSなどで同一ホストに複数のWebアプリをデプロイしたいとき、ドメインは同じでサブディレクトリ毎にアプリのルートを割り当てるということをよくやると思う。PHPやmod_perl等を使ってApacheの中で動かすことも一般的だが、最近はapacheまたはnginxなどの高…

JSON処理オートマトンの構想

今日は構想したり調べたりで時間を使いすぎてしまってあまり書けることがないのですが、毎日更新のペースを守るためにとりあえず書きます。 JSON処理オートマトンみたいな構想 最近はajaxやHTML5、MongoDBなどJSON花盛りな感じになってるが、JSONはXMLなどと…

HTMLからの本文自動抽出

今日のテーマは、「HTMLファイルから「本文」だけを抽出するアルゴリズム」です。 (本格的な数理というよりは、アドホックな計算式を使ったテクニックになります)では早速。 動機:Webサイトから本文を抜き出したい ニュースサイトや、ブログ、など「テキ…