Chip 2011 November

home *** CD-ROM | disk | FTP | other *** search

/ Chip 2011 November / CHIP_2011_11.iso / Programy / Narzedzia / Calibre / calibre-0.8.18.msi / file_280 / levante.recipe < prev next >

Wrap

Text File | 2011-09-09 | 3.8 KB | 69 lines

from calibre.web.feeds.news import BasicNewsRecipe from calibre.ebooks.BeautifulSoup import Tag class LevanteRecipe(BasicNewsRecipe): __license__ = 'GPL v3' __author__ = 'kwetal' version = 1 language = 'es' description = u'El Mercantil Valenciano' title = u'Levante' oldest_article = 2 max_articles_per_feed = 100 encoding = 'latin1' no_stylesheets = True remove_javascript = True # Feeds taken from http://www.levante-emv.com/servicios/rss/rss.jsp?pServicio=rss # Feed titles are without accented characters for now. Hope to resolve this in the future. feeds = [] feeds.append((u'Portada Valencia', u'http://www.levante-emv.com/elementosInt/rss/1')) feeds.append((u'Portada Castello', u'http://www.levante-emv.com/elementosInt/rss/2')) feeds.append((u'Portada Alacant', u'http://www.levante-emv.com/elementosInt/rss/3')) feeds.append((u'Lo Mas Leido', u'http://www.levante-emv.com/elementosInt/rss/LoMas')) feeds.append((u'Seccion al minuto', u'http://www.levante-emv.com/elementosInt/rss/AlMinuto')) feeds.append((u'Comunidad Valenciana', u'http://www.levante-emv.com/elementosInt/rss/19')) feeds.append((u'Valencia', u'http://www.levante-emv.com/elementosInt/rss/16')) feeds.append((u'Castello', u'http://www.levante-emv.com/elementosInt/rss/4')) feeds.append((u'Alacant', u'http://www.levante-emv.com/elementosInt/rss/17')) feeds.append((u'Comarcas', u'http://www.levante-emv.com/elementosInt/rss/12')) feeds.append((u'Espana', u'http://www.levante-emv.com/elementosInt/rss/6')) feeds.append((u'Internacional', u'http://www.levante-emv.com/elementosInt/rss/7')) feeds.append((u'Opinion', u'http://www.levante-emv.com/elementosInt/rss/5')) feeds.append((u'Economia', u'http://www.levante-emv.com/elementosInt/rss/8')) feeds.append((u'Sociedad', u'http://www.levante-emv.com/elementosInt/rss/9')) feeds.append((u'Sucesos', u'http://www.levante-emv.com/elementosInt/rss/10')) feeds.append((u'Deportes', u'http://www.levante-emv.com/elementosInt/rss/11')) feeds.append((u'Motor', u'http://www.levante-emv.com/elementosInt/rss/31')) feeds.append((u'Panorama', u'http://www.levante-emv.com/elementosInt/rss/18')) feeds.append((u'Salud y Vida', u'http://www.levante-emv.com/elementosInt/rss/20')) feeds.append((u'Ciencia y Salud', u'http://www.levante-emv.com/elementosInt/rss/44')) feeds.append((u'Ciencia e Investigacion', u'http://www.levante-emv.com/elementosInt/rss/23')) feeds.append((u'Ensenanza', u'http://www.levante-emv.com/elementosInt/rss/22')) feeds.append((u'Fiestas y Tradiciones', u'http://www.levante-emv.com/elementosInt/rss/24')) feeds.append((u'Club Diario', u'http://www.levante-emv.com/elementosInt/rss/26')) feeds.append((u'Juntos', u'http://www.levante-emv.com/elementosInt/rss/33')) feeds.append((u'Integrados', u'http://www.levante-emv.com/elementosInt/rss/35')) feeds.append((u'Agenda', u'http://www.levante-emv.com/elementosInt/rss/36')) feeds.append((u'Cultura', u'http://www.levante-emv.com/elementosInt/rss/39')) feeds.append((u'Tecnologia', u'http://www.levante-emv.com/elementosInt/rss/40')) feeds.append((u'Gente', u'http://www.levante-emv.com/elementosInt/rss/41')) feeds.append((u'Television', u'http://www.levante-emv.com/elementosInt/rss/42')) feeds.append((u'Participa', u'http://www.levante-emv.com/elementosInt/rss/45')) keep_only_tags = [dict(name='div', attrs={'class' : 'noticia_titular'}), dict(name='div', attrs={'class' : 'subtitulo'}), dict(name='div', attrs={'id' : 'noticia_texto', 'class' : 'noticia_texto'})] def preprocess_html(self, soup): # Nuke some real crappy html theirHead = soup.head theirHead.extract() myHead = Tag(soup, 'head') soup.insert(0, myHead) return soup