home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / database / informix / 3078 < prev    next >
Encoding:
Internet Message Format  |  1993-01-28  |  1.4 KB

  1. Path: sparky!uunet!charon.amdahl.com!pacbell.com!decwrl!sdd.hp.com!elroy.jpl.nasa.gov!ames!haven.umd.edu!umd5!rich
  2. From: rich@astro.umd.edu (Rich Puchalsky)
  3. Newsgroups: comp.databases.informix
  4. Subject: Informix full text searching
  5. Message-ID: <18171@umd5.umd.edu>
  6. Date: 27 Jan 93 02:35:30 GMT
  7. Sender: news@umd5.umd.edu
  8. Organization: U. of Maryland @ College Park, Astronomy
  9. Lines: 16
  10.  
  11. I use Informix 4gl/SQL/Online 4.1 a good deal for numeric applications.
  12. Unfortunately, I've had some problems with large text fields.  What
  13. I would like to implement in many cases is a "full text" search; the
  14. ability for the user to search for records by matching individual
  15. words or word groups in a large text field.  Of course, anyone can search 
  16. a large text field by searching where field matches "*word*", but
  17. this is very slow and Informix does not use any indexes on the field
  18. when you search using a leading wildcard.  I've thought of implementing
  19. this kind of search by creating a detail table with each record consisting
  20. of a single word or word group from the main table.  This detail table
  21. could then be indexed and searched fairly quickly.  The problems with
  22. this scheme, aside from the extra disk space needed to hold the detail
  23. table, involve finding a good method of breaking down normal text into
  24. words and word groups while avoiding "noise words" like "the", "and",
  25. and "a" that no one would want to search on.  Has anyone out there
  26. implemented such a scheme using Informix?
  27.