上記の広告は1ヶ月以上更新のないブログに表示されています。
    新しい記事を書く事で広告が消せます。

    ruby mechanize link 抽出できない (パーサ変更編)

    ruby -v
    ⇒ruby 1.8.7 (2010-01-10 patchlevel 249) [i386-mswin32]
    gem list --local
    ⇒mechanize (1.0.0)

    という環境で、
    とあるページのリンクを抽出していましたが、
    まったく抽出されないという現象が起きました。

    いろいろ調べてみると、リンクに%を含むページの解析がうまくいかないという現象が以前あったようです。
    ただし、バージョンが古いもので、今は解消されているということでした。

    まぁ怪しいことに変わりはないので、
    Htmlパーサの種類を変えてみることにしました。

    nokogiri⇒hpricotへ変更します。

    Step1
    hpricotをインストールします。
    gem install hpricot

    Step2
    Rubyスクリプトの先頭のほうに
    require 'hpricot'
    Mechanize.html_parser = Hpricot

    という記述を追加します。

    これで、今回の目的のページ解析ができるようになりました。
    めでたしめでたしです。
    ではまた!

    コメントの投稿

    非公開コメント

    Google広告
    Amazon商品紹介
    Amazon
    楽天
    最新記事
    最新コメント
    最新トラックバック
    月別アーカイブ
    プロフィール

    アブラクサス太郎

    Author:アブラクサス太郎
    FC2ブログへようこそ!

    カテゴリ
    検索フォーム
    RSSリンクの表示
    リンク
    ブロとも申請フォーム

    この人とブロともになる

    QRコード
    QR
    上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。