home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / h1.recipe < prev    next >
Text File  |  2011-09-09  |  2KB  |  52 lines

  1. # -*- coding: utf-8 -*-
  2. import re
  3. from calibre.web.feeds.recipes import BasicNewsRecipe
  4.  
  5. class hu168ora(BasicNewsRecipe):
  6.     title                 = u'168 ├│ra'
  7.     __author__            = u'Istv├ín Papp'
  8.     description           = u'A 168 ├│ra friss h├¡rei'
  9.     timefmt               = ' [%Y. %b. %d., %a.]'
  10.     oldest_article        = 7
  11.     language              = 'hu'
  12.  
  13.     max_articles_per_feed = 100
  14.     no_stylesheets        = True
  15.     use_embedded_content  = False
  16.     encoding              = 'utf8'
  17.     publisher             = u'Telegr├íf Kiad├│'
  18.     category              = u'news, h├¡rek, 168'
  19.     extra_css             = 'body{ font-family: Verdana,Helvetica,Arial,sans-serif }'
  20.     preprocess_regexps    = [(re.compile(r'<!--.*?-->', re.DOTALL), lambda m: '')]
  21.     keep_only_tags        = [
  22.                               dict(id='cikk_fejlec')
  23.                              ,dict(id='cikk_torzs')
  24.                             ]
  25. #    remove_tags_before    = dict(id='cikk_fejlec')
  26. #    remove_tags_after     = dict(id='szoveg')
  27.     remove_tags           = [
  28.                               dict(id='box_toolbar')
  29.                              ,dict(id='text')
  30.                             ]
  31.     remove_javascript     = True
  32.     remove_empty_feeds    = True
  33.  
  34.  
  35.     feeds = [
  36.               (u'Itthon', u'http://www.168ora.hu/static/rss/cikkek_itthon.xml')
  37.              ,(u'Gl├│busz', u'http://www.168ora.hu/static/rss/cikkek_globusz.xml')
  38.              ,(u'Punch', u'http://www.168ora.hu/static/rss/cikkek_punch.xml')
  39.              ,(u'Arte', u'http://www.168ora.hu/static/rss/cikkek_arte.xml')
  40.              ,(u'Buxa', u'http://www.168ora.hu/static/rss/cikkek_buxa.xml')
  41.              ,(u'Sebess├⌐g', u'http://www.168ora.hu/static/rss/cikkek_sebesseg.xml')
  42.              ,(u'Tud├ís', u'http://www.168ora.hu/static/rss/cikkek_tudas.xml')
  43.              ,(u'Sport', u'http://www.168ora.hu/static/rss/cikkek_sport.xml')
  44.              ,(u'V├⌐lem├⌐ny', u'http://www.168ora.hu/static/rss/cikkek_velemeny.xml')
  45.              ,(u'Dolce Vita', u'http://www.168ora.hu/static/rss/cikkek_dolcevita.xml')
  46. #             ,(u'R├ídi├│', u'http://www.168ora.hu/static/rss/radio.xml')
  47.             ]
  48.  
  49.     def print_version(self, url):
  50.         url += '?print=1'
  51.         return url
  52.