home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / sys / novell / 11034 < prev    next >
Encoding:
Internet Message Format  |  1993-01-03  |  1.5 KB

  1. Path: sparky!uunet!mcsun!hp4at.eunet.co.at!actrix!paul
  2. From: paul@actrix.co.at (Paul Gillingwater)
  3. Newsgroups: comp.sys.novell
  4. Subject: Re: Searching documwnts for key words
  5. Message-ID: <0TcTwB1w165w@actrix.co.at>
  6. Date: Sun, 03 Jan 93 16:21:20 ECT
  7. References: <1993Jan2.184211.19489@trentu.ca>
  8. Distribution: world
  9. Organization: Home Office in Vienna, Austria
  10. Lines: 26
  11.  
  12. ccksb@trentu.ca (Ken Brown) writes:
  13.  
  14. > In article <Z7FkwB1w165w@actrix.co.at> paul@actrix.co.at (Paul Gillingwater) 
  15. > >jc@i5120h.nrl.navy.mil (J. Clark) writes:
  16.  
  17. > >> on a LAN, looking for key words.  Suppose users need to find
  18. > >> all docs that contained the words 'NOVELL NETWARE'.  I could 
  19. > >> enter it in and let the software go looking.  It would be ideal
  20. > >> to be able to setup predefined paths, etc.
  21. > >
  22. > >Two products spring to mind: high end, expensive TOPIC or networkable
  23. > >DOS-based ISYS.  Sorry, don't know vendor addresses.
  24. > What about the Norton Utilities?  The utility ts (text search) will do
  25. > this for you.  There's a variety of other great utilities with it.  I
  26. > think Norton is now produced by Symantec (spelling?).
  27.  
  28. I guess one reason why I didn't recommend ts or grep is the approach
  29. they take to searching -- simply a "brute force" linear search.  In
  30. large textbases, this can unduly burden a server.  A far better approach
  31. is to build inverted indexes of all words (eliminating common words like
  32. "a", "the", "and" etc) and use the indexes only to search.
  33.  
  34. --
  35. paul@actrix.co.at (Paul Gillingwater)
  36. Home Office in Vienna, Austria
  37.