home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / idnes.recipe < prev    next >
Text File  |  2011-09-09  |  2KB  |  55 lines

  1. from calibre.web.feeds.recipes import BasicNewsRecipe
  2.  
  3. class iHeuteRecipe(BasicNewsRecipe):
  4.     __author__  = 'FunThomas'
  5.     title = u'iDnes.cz'
  6.     publisher = u'MAFRA a.s.'
  7.     description = 'iDNES.cz Zpr├ívy, Technet, Komiksy a dal┼í├¡'
  8.     oldest_article = 3
  9.     max_articles_per_feed = 2
  10.  
  11.     feeds = [
  12.             (u'Zpr├ívy', u'http://servis.idnes.cz/rss.asp?c=zpravodaj'),
  13.             (u'Sport', u'http://servis.idnes.cz/rss.asp?c=sport'),
  14.             (u'Technet', u'http://servis.idnes.cz/rss.asp?c=technet'),
  15.             (u'Mobil', u'http://servis.idnes.cz/rss.asp?c=mobil'),
  16.             (u'Ekonomika', u'http://servis.idnes.cz/rss.asp?c=ekonomikah'),
  17.             #(u'Kultura', u'http://servis.idnes.cz/rss.asp?c=kultura'),
  18.             (u'Cestov├ín├¡', u'http://servis.idnes.cz/rss.asp?c=iglobe'),
  19.             #(u'Kav├írna', u'http://servis.idnes.cz/rss.asp?r=kavarna'),
  20.             (u'Komixy', u'http://servis.idnes.cz/rss.asp?c=komiksy')
  21.             ]
  22.  
  23.  
  24.     encoding = 'cp1250'
  25.     language = 'cs'
  26.     cover_url = 'http://g.idnes.cz/u/loga-n4/idnes.gif'
  27.     remove_javascript = True
  28.     no_stylesheets = True
  29.  
  30.     remove_attributes = ['width','height']
  31.     remove_tags = [dict(name='div',   attrs={'id':['zooming']}),
  32.                    dict(name='div',   attrs={'class':['related','mapa-wrapper']}),
  33.                    dict(name='table', attrs={'id':['opener-img','portal']}),
  34.                    dict(name='table', attrs={'class':['video-16ku9']})]
  35.     remove_tags_after  = [dict(name='div',attrs={'id':['related','related2']})]
  36.  
  37.     keep_only_tags = [dict(name='div', attrs={'class':['art-full adwords-text','dil-day','art-full']})
  38.                       ,dict(name='table',attrs={'class':['kemel-box']})]
  39.  
  40.     def print_version(self, url):
  41.         print_url = url
  42.         split_url = url.split("?")
  43.         if (split_url[0].rfind('dilbert.asp')  != -1):      #dilbert komix
  44.             print_url = print_url.replace('.htm','.gif&tisk=1')
  45.             print_url = print_url.replace('.asp','.aspx')
  46.         elif (split_url[0].rfind('kemel.asp')  == -1):      #not Kemel komix
  47.             print_url = 'http://zpravy.idnes.cz/tiskni.asp?' +  split_url[1]
  48.         #kemel                  kemel print page doesn't work
  49.         return print_url
  50.  
  51.     extra_css = '''
  52.                   h1 {font-size:125%; font-weight:bold}
  53.                   h3 {font-size:110%; font-weight:bold}
  54.                 '''
  55.