WindowsのRuby 2.0でXML解析のNokogiriを使うのにちょっと苦労しましたのでどう解決したかを記録しておきます。 使っているRubyはrubyinstallerの2.0.0で、WindowsにはMinGW/MSYSが導入済みです。Installing Nokogiriには Luckily for you, building on Windows is so difficult that we’ve done it for you などと書いてありましたが してもエラーになるばかりでした。 解決方法 どう解決したかを端的に言うとlibxml2, libxsltを自前でコンパイルしました。なので WindowsのRuby 2.0でNokogiriを使う 手順はこうなります。 libxml2 の最新版を自前でコンパイル&インストールする ftp://xmlsoft.org/li
HpricotからNokogiriに移行しようとしていくつか罠にはまったのでメモしておきます。 基本的には require "hpricot" → require "nokogiri" Hpricot(html) → Nokogiri::HTML(html) Hpricot::XML(xml) → Nokogiri::XML(xml) と書き換えるだけで、運が良ければそのまま動くと思います。 Nokogiri(text)というのもあるのですが、これはXMLかHTMLかを自動判定するらしく、失敗することもあるのでお勧めしません。 NokogiriはHpricotと違ってXML名前空間をきちんと解釈するので、XML名前空間を使ったXMLを解析する場合には注意が必要です。XML名前空間を使ったXMLというのは、以下のようにxmlnsなんとかというのが入っているやつです。 <feed xmlns=
いや、バグでもなんでもなく、単に自分が使い方を知らなかったというだけなのだが。 次のようなHTML文書があるとして(抜粋)、 <DIV> <UL> <LI>...</LI> <LI>...</LI> ... </UL> </DIV> LIを取りたいなぁ、と思って次のようなコードを書いてみる。 doc = Nokogiri::HTML(open('/path/to/hoge.html').read) puts doc.xpath('//DIV/UL/LI').text …なにも表示されない。 しかし、XPath式を小文字で書くと表示される。 puts doc.xpath('//div/ul/li').text なぜ? XPath式って小文字じゃないとダメって規約だったっけ?そもそも大文字小文字を区別してたっけ?HTMLには区別は無いはずだが、XMLにはあるから、XML由来のXPathもまた違
黄片一级日日夜夜-亚洲美女图片一二三区-真人一级a爱做片毛片-欧美一级aa片系列,国产a一级毛片视频一级,国产高中学一级毛片在线视频,中国黄色一级毛片视频
もういくつ寝ると 今年のはじめにやりたいことリストを作った。今見たら50項目あるリストのうち25個が達成済みだった。ちょうど半分やりたいことをやったということだ。私にしてはまあまあの結果だと思う。満足。 やりたいことリストにあるもののうち、「〜を食べたい」系は概ねクリアし…
require 'rubygems' require 'nokogiri' require 'open-uri' url = "http://www.walmart.com/search/search-ng.do?search_constraint=0&ic=48_0&search_query=batman&Find.x=0&Find.y=0&Find=Find" doc = Nokogiri::HTML(open(url)) puts doc.at_css("title").text doc.css(".item").each do |item| title = item.at_css(".prodLink").text price = item.at_css(".PriceCompare .BodyS, .PriceXLBold").text[/\$[0-9\.]+/] puts "#
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く