home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / interia_fakty.recipe < prev    next >
Text File  |  2011-09-09  |  1KB  |  40 lines

  1. #!/usr/bin/env  python
  2.  
  3. __license__   = 'GPL v3'
  4. __copyright__ = u'2010, Tomasz Dlugosz <tomek3d@gmail.com>'
  5. '''
  6. fakty.interia.pl
  7. '''
  8.  
  9. from calibre.web.feeds.news import BasicNewsRecipe
  10.  
  11. class InteriaFakty(BasicNewsRecipe):
  12.     title          = u'Interia.pl - Fakty'
  13.     description    = u'Fakty ze strony interia.pl'
  14.     language = 'pl'
  15.     oldest_article = 7
  16.     __author__ = u'Tomasz D\u0142ugosz'
  17.     simultaneous_downloads = 2
  18.     no_stylesheets = True
  19.     remove_javascript = True
  20.     max_articles_per_feed = 100
  21.  
  22.     feeds          = [(u'Kraj', u'http://kanaly.rss.interia.pl/kraj.xml'),
  23.                       (u'\u015awiat', u'http://kanaly.rss.interia.pl/swiat.xml'), 
  24.                       (u'Wiadomo\u015bci dnia', u'http://kanaly.rss.interia.pl/fakty.xml'), 
  25.                       (u'Przegl\u0105d prasy', u'http://kanaly.rss.interia.pl/przeglad_prasy.xml'), 
  26.                       (u'Wywiady', u'http://kanaly.rss.interia.pl/wywiady.xml'), 
  27.                       (u'Ciekawostki', u'http://kanaly.rss.interia.pl/ciekawostki.xml')]
  28.  
  29.     keep_only_tags = [dict(name='div', attrs={'id':'article'})]
  30.  
  31.     remove_tags = [
  32.         dict(name='div', attrs={'class':'box fontSizeSwitch'}),
  33.         dict(name='div', attrs={'class':'clear'}),
  34.         dict(name='div', attrs={'class':'embed embedLeft articleEmbedArticleList articleEmbedArticleListTitle'}),
  35.         dict(name='span', attrs={'class':'keywords'})]
  36.  
  37.     extra_css = '''
  38.         h2 { font-size: 1.2em; }
  39.     '''
  40.