home *** CD-ROM | disk | FTP | other *** search
/ PC World 2001 April / PCWorld_2001-04_cd.bin / Software / TemaCD / webclean / config / adverts.zap < prev    next >
Extensible Markup Language  |  2001-01-16  |  6KB  |  223 lines

  1. <?xml version="1.0"?>
  2. <!DOCTYPE filter SYSTEM "filter.dtd">
  3. <filter title="Advertisements"
  4.  id="1"
  5.  time="979387847"
  6.  desc="A lot of web sites have advertisments. The typical advert has an anchor tag and included the advert image:  <a href="http://company.com"><img  src="http://adserver.de/banner.gif"><a>.  So we search for the <a> tag and remove it.">
  7.  
  8. <rewrite title="/werbung"
  9.  id="0"
  10.  time="0"
  11.  desc="Kill links with the german ad word.">
  12. <attr>/werbung</attr>
  13. </rewrite>
  14.  
  15. <rewrite title="Ad servers 1"
  16.  id="1"
  17.  time="0"
  18.  desc="Kill links with ad words in the host name.">
  19. <attr>http://adse?rv.*\.(com|net)</attr>
  20. </rewrite>
  21.  
  22. <rewrite title="Ad servers 2"
  23.  id="2"
  24.  time="0"
  25.  desc="Kill links with ad words in the host name.">
  26. <attr>http://.*(doubleclick|adforce|tradedoubler|netadsrv|adrunner)\.</attr>
  27. </rewrite>
  28.  
  29. <rewrite title="Ad servers 3"
  30.  id="3"
  31.  time="0"
  32.  desc="Kill links with ad words in the host name.">
  33. <attr>http://ad.*\.flycast\.com</attr>
  34. </rewrite>
  35.  
  36. <rewrite title="Ad servers 4"
  37.  id="4"
  38.  time="0"
  39.  desc="Kill links with ad words in the host name.">
  40. <attr>http://(eur\.)?rd\.yahoo\.com</attr>
  41. </rewrite>
  42.  
  43. <rewrite title="Ad servers 5"
  44.  id="5"
  45.  time="0"
  46.  desc="Kill links with ad words in the host name.">
  47. <attr>((link|media)exchange|mediaplex|realmedia|imgis|adsynergy|fast(click|counter|graphics)|hitexchange|creative-ads|click(it|finders|burst|here.egroups))\.com</attr>
  48. </rewrite>
  49.  
  50. <rewrite title="Ad servers 6"
  51.  id="6"
  52.  time="0"
  53.  desc="Kill links with ad words in the host name.">
  54. <attr>http://ads?\d*?(click)?\..*\.(com|net)</attr>
  55. </rewrite>
  56.  
  57. <rewrite title="Ad servers 7"
  58.  id="7"
  59.  time="0"
  60.  desc="Kill links with ad words in the host name.">
  61. <attr>http://banner.*\.(com|de)</attr>
  62. </rewrite>
  63.  
  64. <rewrite title="Adverts in the path name 1"
  65.  id="8"
  66.  time="0"
  67.  desc="Kill links with ad words in the path name.">
  68. <attr>/(web)?ad(vert(s)?|click|s)</attr>
  69. </rewrite>
  70.  
  71. <rewrite title="Adverts in the path name 2"
  72.  id="9"
  73.  time="0"
  74.  desc="Kill links with ad words in the path name.">
  75. <attr>/(banner(s|_redirect|/)|clickit|werbung)</attr>
  76. </rewrite>
  77.  
  78. <rewrite title="Adverts in the path name 3"
  79.  id="10"
  80.  time="0"
  81.  desc="Kill links with ad words in the path name.">
  82. <attr>/event\.ng/Type=click</attr>
  83. </rewrite>
  84.  
  85. <rewrite title="Adverts in the path name 4"
  86.  id="11"
  87.  time="0"
  88.  desc="Kill links with ad words in the path name.">
  89. <attr>\.eu-adcenter\.net</attr>
  90. </rewrite>
  91.  
  92. <rewrite title="Adverts in the path name 5"
  93.  id="27"
  94.  time="0"
  95.  desc="Found at debianhelp.org"
  96.  tag="img">
  97. <attr name="src">/images/vbanners</attr>
  98. </rewrite>
  99.  
  100. <image title="Banner at rootprompt.org"
  101.  id="12"
  102.  time="0"
  103.  desc="The website rootprompt.org has a banner image."
  104.  width="468"
  105.  height="60"/>
  106.  
  107. <block title="CGI adverts 1"
  108.  id="13"
  109.  time="0"
  110.  desc="Search for the words "ad" and "click"  in the path and a non-empty query."
  111.  path="(ad.*click|click.*thr|click.*ad)"
  112.  query=".+">http://localhost/</block>
  113.  
  114. <rewrite title="CGI adverts 2"
  115.  id="14"
  116.  time="0"
  117.  desc="This rule matches GIFs served by CGI and with advert words in the path.">
  118. <attr>/cgi-bin/ads?(log)?.*([=&?]|\.gif)</attr>
  119. </rewrite>
  120.  
  121. <block title="CGI adverts 3"
  122.  id="15"
  123.  time="0"
  124.  desc="Search for advert,banner,adid,profileid in the path  and for a non-empty query."
  125.  path="(advert|banner|adid|profileid)"
  126.  query=".+"/>
  127.  
  128. <rewrite title="CGI adverts 4"
  129.  id="16"
  130.  time="0"
  131.  desc="This rule matches GIFs served by CGI and with advert words in the path.">
  132. <attr>/cgi-acc/clickthru.acc\?</attr>
  133. </rewrite>
  134.  
  135. <rewrite title="CGI adverts 5"
  136.  id="17"
  137.  time="0"
  138.  desc="Kill links with ad words in the path name.">
  139. <attr>/cgi-bin/bannerclick</attr>
  140. </rewrite>
  141.  
  142. <rewrite title="Deja.com adverts"
  143.  id="18"
  144.  time="0"
  145.  desc="Kill links with ad words in the host name.">
  146. <attr>www\.deja\.com/jump/</attr>
  147. </rewrite>
  148.  
  149. <rewrite title="German ad servers"
  150.  id="19"
  151.  time="0"
  152.  desc="Kill links with ad words in the host name.">
  153. <attr>(adlink|microexchange|sponsornetz|spezialreporte|emedia|bannercommunity)\.de</attr>
  154. </rewrite>
  155.  
  156. <rewrite title="Heise advert tag"
  157.  id="28"
  158.  time="979246063"
  159.  desc="www.heise.de has an advert tag. Nice :)"
  160.  tag="heiseadvert">
  161. </rewrite>
  162.  
  163. <rewrite title="Heise advert tag 2"
  164.  id="29"
  165.  time="979387847"
  166.  desc="heise.de"
  167.  tag="contentbanner">
  168. </rewrite>
  169.  
  170. <block title="Hosts without DNS name"
  171.  id="20"
  172.  time="0"
  173.  desc="If a host has no DNS name it consists only of numbers, for  example "http://34.55.124.2". A lot of adverts are loaded from such servers. We restrict it further more for CGI queries which fetch GIF images."
  174.  host="^[\d.]+$"
  175.  query="\.gif$"/>
  176.  
  177. <rewrite title="Remove <ilayer> tag"
  178.  id="21"
  179.  time="0"
  180.  desc="Lots of ads come nowadays in ilayer tags."
  181.  tag="ilayer">
  182. </rewrite>
  183.  
  184. <rewrite title="Remove <layer> tag"
  185.  id="22"
  186.  time="0"
  187.  desc="Dont know some example sites, but I dont want layers."
  188.  disable="1"
  189.  tag="layer">
  190. </rewrite>
  191.  
  192. <rewrite title="Use the <nolayer> tag"
  193.  id="23"
  194.  time="0"
  195.  desc="If we remove the <ilayer> and <layer>, use the <nolayer> content."
  196.  disable="1"
  197.  tag="nolayer">
  198. <replace part="tag"/>
  199. </rewrite>
  200.  
  201. <rewrite title="adbouncer"
  202.  id="24"
  203.  time="0"
  204.  desc="Kill links with ad words in the path name.">
  205. <attr>/adbouncer\.phtml</attr>
  206. </rewrite>
  207.  
  208. <rewrite title="easy-cash"
  209.  id="25"
  210.  time="0"
  211.  desc="Kill links with ad words in the host name.">
  212. <attr>easy-cash</attr>
  213. </rewrite>
  214.  
  215. <rewrite title="wohin.heute.de"
  216.  id="26"
  217.  time="0"
  218.  desc="Scheissendreck Werbeframe auf wohin.heute.de, wech damit."
  219.  tag="head">
  220. <enclosed>Werbeframe</enclosed>
  221. <replace part="enclosed"/>
  222. </rewrite>
  223. </filter>