home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / speech / 284 < prev    next >
Encoding:
Text File  |  1992-11-20  |  3.3 KB  |  66 lines

  1. Newsgroups: comp.speech
  2. Path: sparky!uunet!cs.utexas.edu!swrinde!zaphod.mps.ohio-state.edu!menudo.uh.edu!lobster!nuchat!texhrc!texhrc!ak45ldp
  3. From: someone@Texaco.com (Larry D. Pyeatt)
  4. Subject: Re: Could S.Blaster recognize sounds??HELP
  5. Message-ID: <1992Nov20.214205.15858@texhrc.uucp>
  6. Sender: news@texhrc.uucp
  7. Nntp-Posting-Host: aisun
  8. Organization: Texaco
  9. References:  <1992Nov10.154616.6281@gw.wmich.edu>
  10. Date: Fri, 20 Nov 1992 21:42:05 GMT
  11. Lines: 53
  12.  
  13. In article <1992Nov10.154616.6281@gw.wmich.edu>, x89olarte1@gw.wmich.edu writes:
  14. |> I may be naive but that doesn't take my right to ask away  :")
  15.  
  16. That`s okay, we all start out naive.
  17.  
  18. |> The sound board Soundblaster Pro has a mic input.
  19. |> would it be too hard to make a program that once you have in a disk say
  20. |> 100 words saved (the wavelength or whatever) . when you talk into the board 
  21. |> w/the mic it compares it and if it's close enough it performs some action
  22. |> corresponding to that word , and if no one matches do nothing or say
  23. |> "repeat" or some like that ??
  24.  
  25. Well..  It depends on your definition of too hard.  If you have spent the 
  26. last four years learning everything you can about speech recognition systems,
  27. then you would probably be able to do it after a few weeks of heavy programming.
  28. If, however, you are totally new to speech recognition, it will take at least
  29. 6 months of reading and experimentation before you understand enough to begin
  30. solving the problem. I did my MS research in speech recognition with neural
  31. networks.  I have been thinking about trying to do what you are describing.
  32. The main drawback that I see is the fact that the PC really does not have a
  33. lot of computing power, and it is a pain to try and do multi-tasking under
  34. MS-DOS.
  35.  
  36. If you are really interested, you should go to the library and start reading
  37. the scientific journals on speech recognition.  You may want to look at using
  38. a Hidden Markov Model ( HMM ), although it is really not that easy to  
  39. understand at first.  You should also limit the vocabulary to about ten words
  40. for your first attempt.  You should modularize your code as much as possible.
  41. The major modules should perform the following:
  42. 1. signal aquisition,
  43. 2. preprocessing, and
  44. 3. recognition.
  45.  
  46. There are several different approaches to preprocessing.  The preprocessing
  47. tecnique can make the difference between success and failure.  The result of 
  48. preprocessing is to convert the raw signal into a series of "feature vectors"
  49. which can be fed into the pattern recognizer.  You may want to use 
  50. LPC cepstra, wavelet coeffecients, or any of a number of techniques.  Some
  51. preprocessing techinques model the physical and neuronal processing which
  52. takes place in the cochlea and aural pathways.  Other techniques ignore
  53. biological systems and strike out in their own direction.
  54.  
  55. The recognizer takes a series of feature vectors and tries to relate them
  56. to known patterns.  There are a lot of ways to solve this problem.  Some
  57. approaches are good for single speaker, small vocabulary problems while 
  58. others may be better suited to speaker independent, medium vocabulary 
  59. problems.
  60.  
  61. -- 
  62. Larry D. Pyeatt                 The views expressed here are not
  63. Internet : pyeatt@texaco.com    those of my employer or of anyone
  64. Voice    : (713) 975-4056       that I know of with the possible
  65.                                 exception of myself.
  66.