home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / sme.recipe < prev    next >
Text File  |  2011-09-09  |  3KB  |  70 lines

  1. from calibre.web.feeds.news import BasicNewsRecipe
  2. import re
  3.  
  4. class SmeRecipe(BasicNewsRecipe):
  5.     __license__  = 'GPL v3'
  6.     __author__ = 'kwetal'
  7.     language = 'sk'
  8.     version = 1
  9.  
  10.     title = u'SME'
  11.     publisher = u''
  12.     category = u'News, Newspaper'
  13.     description = u'News from Slovakia'
  14.  
  15.     oldest_article = 1
  16.     max_articles_per_feed = 100
  17.     use_embedded_content = False
  18.     remove_empty_feeds = True
  19.  
  20.     no_stylesheets = True
  21.     remove_javascript = True
  22.  
  23.     # Feeds from: http://rss.sme.sk/
  24.     feeds = []
  25.     feeds.append((u'Tituln\u00E1 strana', u'http://rss.sme.sk/rss/rss.asp?id=frontpage'))
  26.     feeds.append((u'Naj\u010D\u00EDtanej\u0161ie za 4 hodiny', u'http://rss.sme.sk/rss/rss.asp?id=smenajcit4'))
  27.     feeds.append((u'Naj\u010D\u00EDtanej\u0161ie za 24 hod\u00EDn', u'http://rss.sme.sk/rss/rss.asp?id=smenajcit24'))
  28.     feeds.append((u'Z domova', u'http://rss.sme.sk/rss/rss.asp?sek=smeonline&rub=online_zdom'))
  29.     feeds.append((u'Zahrani\u010Die', u'http://rss.sme.sk/rss/rss.asp?sek=smeonline&rub=online_zahr'))
  30.     feeds.append((u'Z domova + zahrani\u010Die', u'http://rss.sme.sk/rss/rss.asp?sek=smeonline'))
  31.     feeds.append((u'Ekonomika', u'http://rss.sme.sk/rss/rss.asp?sek=ekon'))
  32.     feeds.append((u'Kult\u00FAra', u'http://rss.sme.sk/rss/rss.asp?sek=kult'))
  33.     feeds.append((u'Koment\u00E1re', u'http://rss.sme.sk/rss/rss.asp?sek=koment'))
  34.     feeds.append((u'Volby', u'http://rss.sme.sk/rss/rss.asp?sek=eVolby'))
  35.     #feeds.append((u'Press foto', u'http://rss.sme.sk/rss/rss.asp?sek=smeonline&rub=online_foto'))
  36.     feeds.append((u'\u0160port', u'http://rss.sme.sk/rss/rss.asp?sek=sport'))
  37.     feeds.append((u'Futbal', u'http://rss.sme.sk/rss/rss.asp?sek=futbal'))
  38.     feeds.append((u'Hokej', u'http://rss.sme.sk/rss/rss.asp?sek=hokej'))
  39.     feeds.append((u'Po\u010D\u00EDta\u010De', u'http://rss.sme.sk/rss/rss.asp?sek=pocit'))
  40.     feeds.append((u'Mobil', u'http://rss.sme.sk/rss/rss.asp?sek=mobil'))
  41.     feeds.append((u'Veda', u'http://rss.sme.sk/rss/rss.asp?sek=veda'))
  42.     feeds.append((u'Natankuj', u'http://rss.sme.sk/rss/rss.asp?sek=natankuj'))
  43.     feeds.append((u'Auto', u'http://rss.sme.sk/rss/rss.asp?sek=auto'))
  44.     feeds.append((u'Dom\u00E1cnos\u0165', u'http://rss.sme.sk/rss/rss.asp?sek=domac'))
  45.     feeds.append((u'\u017Dena', u'http://rss.sme.sk/rss/rss.asp?sek=zena'))
  46.     feeds.append((u'Z\u00E1bava', u'http://rss.sme.sk/rss/rss.asp?sek=zabava'))
  47.     feeds.append((u'Hry', u'http://rss.sme.sk/rss/rss.asp?sek=hry'))
  48.     #feeds.append((u'', u''))
  49.  
  50.     keep_only_tags = []
  51.     keep_only_tags.append(dict(name = 'div', attrs = {'id': 'contenth'}))
  52.     keep_only_tags.append(dict(name = 'div', attrs = {'class': 'articlec col'}))
  53.  
  54.     remove_tags = []
  55.     remove_tags.append(dict(name = 'div', attrs = {'id': re.compile('smeplayer.*')}))
  56.  
  57.     remove_tags_after = [dict(name = 'p', attrs = {'class': 'autor_line'})]
  58.  
  59.     extra_css = '''
  60.                 @font-face {font-family: "serif1";src:url(res:///opt/sony/ebook/FONT/tt0011m_.ttf)}
  61.                 @font-face {font-family: "sans1";src:url(res:///opt/sony/ebook/FONT/LiberationSans.ttf)}
  62.                 body {font-family: sans1, serif1;}
  63.                 '''
  64.  
  65.     def print_version(self, url):
  66.         parts = url.split('/')
  67.         id = parts[4]
  68.  
  69.         return u'http://korzar.sme.sk/clanok_tlac.asp?cl=' + str(id)
  70.