home *** CD-ROM | disk | FTP | other *** search
/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / juventudrebelde.recipe < prev    next >
Encoding:
Text File  |  2011-09-09  |  2.3 KB  |  47 lines

  1. __license__   = 'GPL v3'
  2. __copyright__ = '2011, Oscar Megia Lopez'
  3. '''
  4. juventudrebelde.cu
  5. '''
  6. import re
  7. from calibre.web.feeds.recipes import BasicNewsRecipe
  8.  
  9. class JuventudRebelde(BasicNewsRecipe):
  10.     title                  = u'Juventud Rebelde'
  11.     __author__             = 'Oscar Megia Lopez'
  12.     description            = 'Periodico cubano'
  13.     oldest_article         = 30
  14.     max_articles_per_feed  = 100
  15.     no_stylesheets         = True
  16.     #delay                  = 1
  17.     use_embedded_content   = False
  18.     encoding               = 'utf8'
  19.     publisher              = 'Juventud Rebelde'
  20.     category               = 'Noticias'
  21.     language               = 'es'
  22.     publication_type       = 'Periodico'
  23.     extra_css              = ' body{ font-family: Verdana,Helvetica,Arial,sans-serif } .title{font-weight: bold} .read{display: block; padding: 0; border: 1px solid; width: 40%; font-size: small} .story-feature h2{text-align: center; text-transform: uppercase} '
  24.     preprocess_regexps     = [(re.compile(r'<!--.*?-->', re.DOTALL), lambda m: '')]
  25.     conversion_options = {
  26.                              'comments'        : description
  27.                             ,'tags'            : category
  28.                             ,'language'        : language
  29.                             ,'publisher'       : publisher
  30.                             ,'linearize_tables': True
  31.                          }
  32.  
  33.     keep_only_tags    = [
  34.                        dict(name='div', attrs={'class':['title']})
  35.                        ,dict(attrs={'class':['read']})
  36.                        ,dict(attrs={'class':['author']})
  37.                         ]
  38.  
  39.     remove_tags = [
  40.                        dict(name='div', attrs={'class':['share']}),
  41.                   ]
  42.  
  43.     remove_attributes = ['width','height']
  44.  
  45.     feeds          = [(u'Generales', u'http://www.juventudrebelde.cu/get/rss/grupo/generales/'), (u'Internacionales', u'http://www.psychologytoday.com/blog/romance-redux/feed'), (u'Ciencia y Tecnica', u'http://www.juventudrebelde.cu/get/rss/noticias/ciencia-tecnica/'), (u'Opini\xf3n', u'http://www.juventudrebelde.cu/get/rss/noticias/opinion/'), (u'Cuba', u'http://www.juventudrebelde.cu/get/rss/noticias/cuba/'), (u'Cultura', u'http://www.juventudrebelde.cu/get/rss/noticias/cultura/'), (u'Deportes', u'http://www.juventudrebelde.cu/get/rss/noticias/deportes')]
  46.  
  47.