home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / spektrum.recipe < prev    next >
Text File  |  2011-09-09  |  2KB  |  29 lines

  1. from calibre.web.feeds.recipes import BasicNewsRecipe
  2. class AdvancedUserRecipe1303841067(BasicNewsRecipe):
  3.     title          = u'Spektrum (der Wissenschaft)'
  4.     __author__  = 'schuster'
  5.     oldest_article = 7
  6.     max_articles_per_feed = 100
  7.     language               = 'de'
  8.     cover_url = 'http://upload.wikimedia.org/wikipedia/de/3/3b/Spektrum_der_Wissenschaft_Logo.svg'
  9.  
  10.     remove_tags = [dict(attrs={'class':['hauptnaviPkt gainlayout', 'hauptnaviButton', 'suchButton', 'suchbegriffKasten', 'loginButton', 'subnavigation', 'artikelInfoLeiste gainlayout', 'artikelTools', 'nurLetzteSeite', 'link', 'boxUnterArtikel', 'leserbriefeBlock', 'boxTitel', 'boxInhalt', 'sehrklein', 'boxabstand', 'werbeboxinhalt', 'rbabstand', 'bildlinks', 'rechtebox', 'denkmalbox', 'denkmalfrage']}),
  11.     dict(id=['pflip', 'verlagsleiste', 'bereich', 'bannerVertikal', 'headerLogoLink', 'kopf', 'topNavi', 'headerSchnellsuche', 'headerSchnellsucheWarten', 'navigation', 'navigationL', 'navigationR', 'inhalt', 'rechtespalte', 'sdwboxenshop', 'shopboxen', 'fuss']),
  12.     dict(name=['naservice'])]
  13.  
  14.     def print_version(self,url):
  15.         newurl = url.replace('artikel/', 'sixcms/detail.php?id=')
  16.         return newurl + '&_druckversion=1'
  17.  
  18.  
  19.  
  20.     feeds          = [(u'Spektrum der Wissenschaft', u'http://www.spektrum.de/artikel/982623'),
  21.                           (u'SpektrumDirekt', u'http://www.spektrumdirekt.de/artikel/996406'),
  22.                           (u'Sterne und Weltraum', u'http://www.astronomie-heute.de/artikel/865248'),
  23.                           (u'Gehirn & Geist', u'http://www.gehirn-und-geist.de/artikel/982626'),
  24.                           (u'epoc', u'http://www.epoc.de/artikel/982625')
  25.  
  26. ]
  27.  
  28.     filter_regexps = [r'ads\.doubleclick\.net']
  29.