Web

HTMLをスクレイピングしてパースするためのメモ(PHP,Ruby,Perl)

XMLではなく、HTML(とかタグの怪しいXHTML)をパースしたかった。 正規表現は、もうやだ。 (とても、勉強にはなったのは、たしかだれども、 ページの構成が変わるたびに失敗するし そもそも、<-- start -->みたいなのを目印にするには、余りきれいじゃない!)…

AMZNKAssocBotという見慣れないロボットを発見

Web

ログに「AMZNKAssocBot」という見慣れないロボットを見つけました。 googleで調べてみても正体がよくわからない。 名前からするとアマゾン関係の何かなのだろうか? Amazonおまかせリンク(TM)ベータ版が登場したばかりなので、 それ用のページ解析用のクロ…

ネット怖い

Web

閲覧者の方に、自サイトの内容は自サイトで見て欲しい、ただそれだけの事なんです 2chのスレには、何か悪意を感じた。 「土下座したって許さないんだから!本当よ!」みたいな感じ。 怖い。こうなってしまったら、殲滅させられてしまうしかないのだろうか。 …