home *** CD-ROM | disk | FTP | other *** search
/ Chip 2000 May / Chip_2000-05_cd1.bin / zkuste / Perl / ActivePerl-5.6.0.613.msi / 䆊䌷䈹䈙䏵-䞅䞆䞀㡆䞃䄦䠥 / _3299c423883f5b267b6982560b21b3ca < prev    next >
Text File  |  2000-03-23  |  6KB  |  152 lines

  1.  
  2. <HTML>
  3. <HEAD>
  4. <TITLE>WWW::Search::WebCrawler - class for searching WebCrawler</TITLE>
  5. <LINK REL="stylesheet" HREF="../../../../Active.css" TYPE="text/css">
  6. <LINK REV="made" HREF="mailto:">
  7. </HEAD>
  8.  
  9. <BODY>
  10. <TABLE BORDER=0 CELLPADDING=0 CELLSPACING=0 WIDTH=100%>
  11. <TR><TD CLASS=block VALIGN=MIDDLE WIDTH=100% BGCOLOR="#cccccc">
  12. <STRONG><P CLASS=block> WWW::Search::WebCrawler - class for searching WebCrawler</P></STRONG>
  13. </TD></TR>
  14. </TABLE>
  15.  
  16. <A NAME="__index__"></A>
  17. <!-- INDEX BEGIN -->
  18.  
  19. <UL>
  20.  
  21.     <LI><A HREF="#name">NAME</A></LI><LI><A HREF="#supportedplatforms">SUPPORTED PLATFORMS</A></LI>
  22.  
  23.     <LI><A HREF="#synopsis">SYNOPSIS</A></LI>
  24.     <LI><A HREF="#description">DESCRIPTION</A></LI>
  25.     <LI><A HREF="#see also">SEE ALSO</A></LI>
  26.     <LI><A HREF="#how does it work">HOW DOES IT WORK?</A></LI>
  27.     <LI><A HREF="#bugs">BUGS</A></LI>
  28.     <LI><A HREF="#testing">TESTING</A></LI>
  29.     <LI><A HREF="#author">AUTHOR</A></LI>
  30.     <LI><A HREF="#legalese">LEGALESE</A></LI>
  31.     <LI><A HREF="#version history">VERSION HISTORY</A></LI>
  32.     <UL>
  33.  
  34.         <LI><A HREF="#2.02, 19991005">2.02, 1999-10-05</A></LI>
  35.         <LI><A HREF="#2.01, 19990713">2.01, 1999-07-13</A></LI>
  36.         <LI><A HREF="#1.13, 19990329">1.13, 1999-03-29</A></LI>
  37.         <LI><A HREF="#1.11, 19981009">1.11, 1998-10-09</A></LI>
  38.         <LI><A HREF="#1.9">1.9</A></LI>
  39.         <LI><A HREF="#1.7">1.7</A></LI>
  40.         <LI><A HREF="#1.5">1.5</A></LI>
  41.         <LI><A HREF="#1.3">1.3</A></LI>
  42.     </UL>
  43.  
  44. </UL>
  45. <!-- INDEX END -->
  46.  
  47. <HR>
  48. <P>
  49. <H1><A NAME="name">NAME</A></H1>
  50. <P>WWW::Search::WebCrawler - class for searching WebCrawler</P>
  51. <P>
  52. <HR>
  53. <H1><A NAME="supportedplatforms">SUPPORTED PLATFORMS</A></H1>
  54. <UL>
  55. <LI>Linux</LI>
  56. <LI>Solaris</LI>
  57. <LI>Windows</LI>
  58. </UL>
  59. <HR>
  60. <H1><A NAME="synopsis">SYNOPSIS</A></H1>
  61. <PRE>
  62.   use WWW::Search;
  63.   my $oSearch = new WWW::Search('WebCrawler');
  64.   my $sQuery = WWW::Search::escape_query("+sushi restaurant +Columbus Ohio");
  65.   $oSearch->native_query($sQuery);
  66.   while (my $oResult = $oSearch->next_result())
  67.     print $oResult->url, "\n";</PRE>
  68. <P>
  69. <HR>
  70. <H1><A NAME="description">DESCRIPTION</A></H1>
  71. <P>This class is a WebCrawler specialization of WWW::Search.
  72. It handles making and interpreting WebCrawler searches
  73. <EM><A HREF="http://www.WebCrawler.com">http://www.WebCrawler.com</A></EM>.</P>
  74. <P>This class exports no public interface; all interaction should
  75. be done through <A HREF="../../../../site/lib/WWW/Search.html">the WWW::Search manpage</A> objects.</P>
  76. <P>
  77. <HR>
  78. <H1><A NAME="see also">SEE ALSO</A></H1>
  79. <P>To make new back-ends, see <A HREF="../../../../site/lib/WWW/Search.html">the WWW::Search manpage</A>.</P>
  80. <P>
  81. <HR>
  82. <H1><A NAME="how does it work">HOW DOES IT WORK?</A></H1>
  83. <P><CODE>native_setup_search</CODE> is called (from <CODE>WWW::Search::setup_search</CODE>)
  84. before we do anything.  It initializes our private variables (which
  85. all begin with underscore) and sets up a URL to the first results
  86. page in <CODE>{_next_url}</CODE>.</P>
  87. <P><CODE>native_retrieve_some</CODE> is called (from <CODE>WWW::Search::retrieve_some</CODE>)
  88. whenever more hits are needed.  It calls <CODE>WWW::Search::http_request</CODE>
  89. to fetch the page specified by <CODE>{_next_url}</CODE>.
  90. It then parses this page, appending any search hits it finds to 
  91. <CODE>{cache}</CODE>.  If it finds a ``next'' button in the text,
  92. it sets <CODE>{_next_url}</CODE> to point to the page for the next
  93. set of results, otherwise it sets it to undef to indicate we''re done.</P>
  94. <P>
  95. <HR>
  96. <H1><A NAME="bugs">BUGS</A></H1>
  97. <P>Please tell the author if you find any!</P>
  98. <P>
  99. <HR>
  100. <H1><A NAME="testing">TESTING</A></H1>
  101. <P>This module adheres to the <CODE>WWW::Search</CODE> test suite mechanism. 
  102. See $TEST_CASES below.</P>
  103. <P>
  104. <HR>
  105. <H1><A NAME="author">AUTHOR</A></H1>
  106. <P>As of 1998-03-16, <CODE>WWW::Search::WebCrawler</CODE> is maintained by Martin Thurn
  107. (<A HREF="mailto:MartinThurn@iname.com">MartinThurn@iname.com</A>)</P>
  108. <P><CODE>WWW::Search::WebCrawler</CODE> was originally written by Martin Thurn
  109. based on <CODE>WWW::Search::HotBot</CODE>.</P>
  110. <P>
  111. <HR>
  112. <H1><A NAME="legalese">LEGALESE</A></H1>
  113. <P>THIS SOFTWARE IS PROVIDED ``AS IS'' AND WITHOUT ANY EXPRESS OR IMPLIED
  114. WARRANTIES, INCLUDING, WITHOUT LIMITATION, THE IMPLIED WARRANTIES OF
  115. MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE.</P>
  116. <P>
  117. <HR>
  118. <H1><A NAME="version history">VERSION HISTORY</A></H1>
  119. <P>If it's not listed here, then it wasn't a meaningful or released version.</P>
  120. <P>
  121. <H2><A NAME="2.02, 19991005">2.02, 1999-10-05</A></H2>
  122. <P>now uses <CODE>hash_to_cgi_string()</CODE></P>
  123. <P>
  124. <H2><A NAME="2.01, 19990713">2.01, 1999-07-13</A></H2>
  125. <P>
  126. <H2><A NAME="1.13, 19990329">1.13, 1999-03-29</A></H2>
  127. <P>Remove extraneous HTML from description (thanks to Jim Smyser <A HREF="mailto:jsmyser@bigfoot.com)">jsmyser@bigfoot.com)</A></P>
  128. <P>
  129. <H2><A NAME="1.11, 19981009">1.11, 1998-10-09</A></H2>
  130. <P>Now uses split_lines function</P>
  131. <P>
  132. <H2><A NAME="1.9">1.9</A></H2>
  133. <P>1998-08-20: New format of www.webcrawler.com output.</P>
  134. <P>
  135. <H2><A NAME="1.7">1.7</A></H2>
  136. <P>\n changed to \012 for MacPerl compatibility</P>
  137. <P>
  138. <H2><A NAME="1.5">1.5</A></H2>
  139. <P>1998-05-29: New format of www.webcrawler.com output.</P>
  140. <P>
  141. <H2><A NAME="1.3">1.3</A></H2>
  142. <P>First publicly-released version.</P>
  143. <TABLE BORDER=0 CELLPADDING=0 CELLSPACING=0 WIDTH=100%>
  144. <TR><TD CLASS=block VALIGN=MIDDLE WIDTH=100% BGCOLOR="#cccccc">
  145. <STRONG><P CLASS=block> WWW::Search::WebCrawler - class for searching WebCrawler</P></STRONG>
  146. </TD></TR>
  147. </TABLE>
  148.  
  149. </BODY>
  150.  
  151. </HTML>
  152.