[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

ブックマーク / fuba.hatenadiary.org (3)

  • WedataにあるLDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::LDRFullFeed - fubaはてな

    lib/Plagger/Plugin/Filter/EntryFullText/LDRFullFeed.pm http://b.hatena.ne.jp/otsune/20080530#bookmark-8776502 SITEINFOはwedata版に書き換えたほうがよさそう とのことなので書き換えた。HTML::Featureを使ってもっと便利にしたかったのだけど、UAがうまく置き換えられない問題とかが残ってるのであいかわらずEntryFullTextを継承。なのでPPF::EFT::SiteInfoのEFTのyamlがうまく一緒に使えない問題が残ってます。あとPPF::EFT::SiteInfoも野良siteinfoがあればまだ使えるのでこっちは名前かえました。Webservice::WedataはkoyachiさんのところからとってきてくださいWebService::Wedataも

    WedataにあるLDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::LDRFullFeed - fubaはてな
  • HTML::FeaturedImage - URLに含まれる画像のうち、重要そうなものを取り出すためのPerlモジュール - fubaはてな

    yuisekiが「エントリのメイン画像抽出があるといいかも」と言ってたときに、昼飯まで暇だったので作った。結果のサンプルはこちら。 仕組みはてきとう。まずURLをたくさん与え、その先にある画像の数を数える。たくさんのページにでてきたり、何度もおなじページに出てくる画像はどうでもいいものとして、消す。よくあるやり方だけど強力。 よく考えるとHTML::じゃない感じがしてきた。あとで直すかも。HTML::としてふさわしくするため、Web::Scraperにcontent渡せるようにした。 $content = "<html>..."; $hfi->add_page($url, $content);あと、リンク先が画像っぽいURLのときにはa hrefも取るようにした。閾値のキャッシュとかちょっとアルゴリズム変更とか、細かいところも変更。ちょっとノイズ入るようになったけど、たぶん欲しい物は確実に

    HTML::FeaturedImage - URLに含まれる画像のうち、重要そうなものを取り出すためのPerlモジュール - fubaはてな
    ku0522
    ku0522 2007/11/01
    統計的アプローチ。複数ページ中に多数出てくるものを捨てる。しきい値次第でメインのものが残る。
  • Net::Tumblr - fubaはてな

    http://fuba.tumblr.com/post/2327086 こういう仕様なら作るまでもない気がしたけど画像Botのために作ってみたけど一瞬で容量制限溢れたので存在意義がなくなってとりあえず放出。コードはやっぱりはてダの方がいいな…。 usage.pl use Net::Tumblr; my $url = shift; my $t = Net::Tumblr->new( email => 'example@example.com', password => 'password' )->write( type => 'photo', source => $url, caption => "<a href=\"$url\">$url</a>", ); 詳しくはTumblr - API参照。 Net/Tumblr.pm package Net::Tumblr; use strict;

    Net::Tumblr - fubaはてな
    ku0522
    ku0522 2007/08/31
    Quoted: my $t = Net::Tumblr->new( email => 'example@example.com', password => 'password' )->write( type => 'photo', source => $url, caption => "<a href=\"$url\">$url</a>", );
  • 1