home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / kleinezeitung.recipe < prev    next >
Text File  |  2011-09-09  |  2KB  |  54 lines

  1. from calibre.web.feeds.news import BasicNewsRecipe
  2. import re
  3.  
  4. class KleineZeitungRecipe(BasicNewsRecipe):
  5.     __license__  = 'GPL v3'
  6.     __author__ = 'kwetal'
  7.     language = 'de_AT'
  8.     version = 1
  9.  
  10.     title = u'Kleine Zeitung'
  11.     publisher = u'Kleine Zeitung GmbH & Co KG'
  12.     category = u'News, Newspaper'
  13.     description = u'Nachrichten aus \u00D6sterreich'
  14.  
  15.     use_embedded_content = False
  16.     remove_empty_feeds = True
  17.     oldest_article = 2
  18.     max_articles_per_feed = 100
  19.  
  20.     no_stylesheets = True
  21.     remove_javascript = True
  22.  
  23.     # Feeds from http://www.kleinezeitung.at/allgemein/multimedia/102434/wichtige-news-immer-sofort-ueber-rss-feed-abrufen.story
  24.     feeds = []
  25.     feeds.append((u'Chronik', u'http://www.kleinezeitung.at/klon/rss/nachrichten'))
  26.     feeds.append((u'Wirtschaft', u'http://www.kleinezeitung.at/klon/rss/wirtschaft'))
  27.     feeds.append((u'Leute', u'http://www.kleinezeitung.at/klon/rss/leute'))
  28.     feeds.append((u'Sport', u'http://www.kleinezeitung.at/klon/rss/sport'))
  29.     feeds.append((u'Nachrichten aus der Steiermark', u'http://www.kleinezeitung.at/klon/rss/steiermark'))
  30.     feeds.append((u'Nachrichten aus Kaernten', u'http://www.kleinezeitung.at/klon/rss/kaernten'))
  31.     feeds.append((u'Multimedia-News', u'http://www.kleinezeitung.at/klon/rss/multimedia'))
  32.     feeds.append((u'Kino, Events & Tickets', u'http://www.kleinezeitung.at/klon/rss/events'))
  33.  
  34.     keep_only_tags = []
  35.     keep_only_tags.append(dict(name = 'div', attrs = {'class': 'article_body'}))
  36.  
  37.     remove_tags = []
  38.     remove_tags.append(dict(name = 'a', attrs = {'id': 'comment_count'}))
  39.     remove_tags.append(dict(name = 'div', attrs = {'class': re.compile('adv[0-9]+')}))
  40.     remove_tags.append(dict(name = 'div', attrs = {'class': 'art_info'}))
  41.     remove_tags.append(dict(name = 'div', attrs = {'id': re.compile('grafikoverlay_.*')}))
  42.     remove_tags.append(dict(name = 'a', attrs = {'class': 'zoom'}))
  43.  
  44.     extra_css = '''
  45.                 body {font-family:verdana,arial,helvetica,geneva,sans-serif ;}
  46.                 h1 {text-align: left;}
  47.                 span {margin-left: 0.1em; margin-right: 0.1em;}
  48.                 span.update {font-size: x-small; color: #666666}
  49.                 span.update strong {font-weight: normal;}
  50.                 p.intro {font-size: large;}
  51.                 div.art_foto_big, div.art_foto {font-size: xx-small; color: #696969; margin-bottom: 0.5em;}
  52.                 div.art_foto_big span.src {float: right;}
  53.                 '''
  54.