home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / rga.recipe < prev    next >
Text File  |  2011-09-09  |  3KB  |  63 lines

  1. #!/usr/bin/env  python
  2.  
  3. __license__   = 'GPL v3'
  4. __copyright__ = '2009, W. Gerard <wii at gerard-nrw.de>'
  5. '''
  6. rga-online.de
  7. '''
  8.  
  9. from calibre.web.feeds.news import BasicNewsRecipe
  10.  
  11. class rga_onliner(BasicNewsRecipe):
  12.     title                 = 'RGA Online - German'
  13.     __author__            = 'Werner Gerard'
  14.     description           = "E-Zeitung aus RSS-Artikeln zusammengestellt."
  15.     publisher             = 'RGA-Online'
  16.     category              = 'Nachrichten, RGA'
  17.     oldest_article        = 3
  18.     max_articles_per_feed = 100
  19.     language = 'de'
  20.  
  21.     lang                  = 'de-DE'
  22.     no_stylesheets        = True
  23.     use_embedded_content  = False
  24.     encoding              = 'cp1252'
  25.  
  26.     remove_tags_before = dict(name='span', attrs={'class':'headgross'})
  27.     remove_tags_after    = dict(name='br', attrs={'clear':'all'})
  28.  
  29. #    remove_tags_after    = dict(name='br', attrs={'clear':'clear'})
  30.  
  31.     feeds        = [
  32.                             ('RGA-Online Remscheid', 'http://www.rga-online.de/rss/rs_news.php'),
  33.                             ('RGA-Online Wermelskirchen', 'http://www.rga-online.de/rss/wk_news.php'),
  34.                             ('RGA-Online Hueckeswagen', 'http://www.rga-online.de/rss/hk_news.php'),
  35.                             ('RGA-Online Radevormwald', 'http://www.rga-online.de/rss/rz_news.php'),
  36.                             ('RGA-Online Tagesthemen', 'http://www.rga-online.de/rss/tt_news.php'),
  37.                             ('RGA-Online Brennpunkte', 'http://www.rga-online.de/rss/br_news.php'),
  38.                             ('RGA-Online Sport', 'http://www.rga-online.de/rss/spo_news.php'),
  39.                             ('RGA-Online Lokalsport', 'http://www.rga-online.de/rss/sp_news.php'),
  40.                             ('RGA-Online Bergisches Land', 'http://www.rga-online.de/rss/bg_news.php'),
  41.                             ('RGA-Online Bergische Wirtschaft', 'http://www.rga-online.de/rss/bw_news.php')
  42.                           ]
  43. #"print based version"
  44. #    def print_version(self, url):
  45. #         main, separatior, sub = url.rpartition('?')
  46. #          sub1, sep1, artikel = sub.rpartition('&')
  47. #          sub2, sep2, publikation = sub1.rpartition('&')
  48.  
  49.  
  50. #          return 'http://www.pipeline.de/cgi-bin/pipeline.fcg?userid=1&publikation=2&template=druck.html&'+ publikation + '&' + artikel
  51. #          return 'http://www.pipeline.de/cgi-bin/pipeline.fcg?userid=1&publikation=2&template=druck.html&redaktion=2&artikel=109208787'
  52. #                     http://www.pipeline.de/cgi-bin/pipeline.fcg?userid=1&publikation=2&template=druck.html&redaktion=1&artikel=109209772
  53. #     http://www.rga-online.de/lokales/h6ckeswagen.php?publikation=2&template=phparttext&ausgabe=49740&redaktion=2&artikel=109208787
  54.  
  55.  
  56.     def get_cover_url(self):
  57.          return 'http://rga.werner-gerard.de/rga.jpg'
  58.  
  59.     def postprocess_html(self, soup, first):
  60.         for tag in soup.findAll(name=['table', 'tr', 'td']):
  61.             tag.name = 'span'
  62.         return soup
  63.