Perl
VPSなどで同一ホストに複数のWebアプリをデプロイしたいとき、ドメインは同じでサブディレクトリ毎にアプリのルートを割り当てるということをよくやると思う。PHPやmod_perl等を使ってApacheの中で動かすことも一般的だが、最近はapacheまたはnginxなどの高…
今日は構想したり調べたりで時間を使いすぎてしまってあまり書けることがないのですが、毎日更新のペースを守るためにとりあえず書きます。 JSON処理オートマトンみたいな構想 最近はajaxやHTML5、MongoDBなどJSON花盛りな感じになってるが、JSONはXMLなどと…
今日のテーマは、「HTMLファイルから「本文」だけを抽出するアルゴリズム」です。 (本格的な数理というよりは、アドホックな計算式を使ったテクニックになります)では早速。 動機:Webサイトから本文を抜き出したい ニュースサイトや、ブログ、など「テキ…