| Web :: Scraper. Toolkit di raschiatura Web utilizzando i selettori HTML e CSS o le espressioni XPath |
Scarica ora |
Web :: Scraper. Classifica e riepilogo
- Licenza:
- Perl Artistic License
- Nome editore:
- Tatsuhiko Miyagawa
- Sito web dell'editore:
- http://search.cpan.org/~miyagawa/
Web :: Scraper. Tag
Web :: Scraper. Descrizione
Web scraping Toolkit utilizzando espressioni XPath HTML e CSS selettori o Web :: raschietto č un toolkit web raschietto, ispirato equivalente Scrapi di Ruby. Fornisce un'interfaccia DSL-ish per attraversare i documenti HTML e tornando a ordinatamente disposte raschietto ed elaborare blocchi Perl dati strcuture.The fornire un metodo per definire quali segmenti di un documento da estrarre. Si capisce CSS e HTML selettori e XPath uso expressions.SYNOPSIS URI; utilizzare Web :: raschietto; # In primo luogo, creare il tuo blocco raschietto mio $ tweet = {raschietto # Parse tutti LIs con lo "status" di classe, conservarli in un conseguente 'tweet' # array. Incorporiamo un'altra raschietto per ogni tweet. processo "li.status", "tweet []" => {raschietto # E, in tale matrice, tirare in elementy con la classe # "entry-content", "entry-date" e il processo di collegamento" .entry- contenuti", corpo => 'TEXT'; processo ".entry-date", in cui => 'TEXT'; processo 'a ', link => '@href'; }; }; my $ res = $ tweets-> raschiare (URI-> new ( "http://twitter.com/miyagawa")); # Il risultato ha la matrice tweets popolata per il mio $ Tweet (@ {$ res -> {tweets}}) {print "$ Tweet -> {corpo} $ Tweet -> {quando} (link: $ Tweet -> {link })\n"; } Requisiti: · Perl.
Web :: Scraper. Software correlato