home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / rec / audio / 17547 < prev    next >
Encoding:
Internet Message Format  |  1992-12-30  |  3.1 KB

  1. Path: sparky!uunet!zaphod.mps.ohio-state.edu!uwm.edu!linac!att!att!allegra!alice!jj
  2. From: jj@alice.att.com (jj, curmudgeon and all-around grouch)
  3. Newsgroups: rec.audio
  4. Subject: Re: MD and DCC encoding-request for info
  5. Message-ID: <24516@alice.att.com>
  6. Date: 30 Dec 92 17:44:26 GMT
  7. Article-I.D.: alice.24516
  8. References: <shetline-271292211904@128.89.19.80> <DAVE.92Dec30234952@pipi.iis.u-tokyo.ac.jp>
  9. Reply-To: jj@alice.UUCP (jj, curmudgeon and all-around grouch)
  10. Organization: NJ State Home for Bewildered Terminals
  11. Lines: 54
  12.  
  13. In article <DAVE.92Dec30234952@pipi.iis.u-tokyo.ac.jp> dave@pipi.iis.u-tokyo.ac.jp (David Wuertele) writes:
  14. >In article <shetline-271292211904@128.89.19.80> shetline@bbn.com (Kerry Shetline) writes:
  15. >> If they [MD or DCC] only handle PCM data, would there be a generational
  16. >> degradation when copying MDs/DCCs (forgetting about serial copy mgt for the
  17. >> moment)? It seems to me quite likely that there could be -- calculation
  18. >> round-offs, inconsistent "framing" of the PCM data stream...
  19. >
  20. >Yes, there will be if there is any type of vector quantization going on in
  21. >the compression (block transform + quant schemes are a subset of all
  22. >vector quant schemes), because the PCM data stream has no framing
  23. >information to keept the vectors consistent.  There is also a possibility
  24. >that pre- and post- filtering is conducted, which will degrade even more.
  25. >
  26. >Dave
  27.  
  28. Oh, sheeesh.
  29.  
  30. Both coders (ATRAC and MUSICAM/PASC/ISO Layer I and II) are lossy
  31. perceptual coders.
  32.  
  33. They both work on the same general principle, using this sort of block diagram:
  34.  
  35. --------> Filter Bank   -------->  Rate Control  ----> Bitstream generation
  36.    |                                  ^
  37.    |                                  |
  38.    |                                  |
  39.    -----> Perceptual Model -----------
  40.  
  41.  
  42. In MUSICAM the filter bank is a 32 band polyphase filter bank
  43. by Dehery  et. al after Crochiere and Rabiner "Multirate Digital
  44. Signal Processing", the Perceptual Model is a Zwicker-based
  45. model (See ISO-MPEG-1 Draft Audio Standard),  the rate control
  46. is based on 3 groups of 384 samples in time/frequency, and the
  47. bitstream uses PCM and some minimal radix encoding to do 
  48. transmission/storage.
  49.  
  50. In ATRAC the filter bank is an MDCT (See Princen and Bradley's
  51. ICASSP paper 1987), the perceptual model isn't published, the
  52. rate control is some kind of block companding, and the bitstream
  53. unpublished.  The MDCT is switched in length, it's not clear what
  54. choices are supported presently.
  55.  
  56. A good place to read about this stuff is "Advances in Speech Signal
  57. Processing", Furui and Sondhi, Chapter 4, by Brandenburg and Johnston.
  58. Marcel Dekker, NY 1992.   For newer stuff see the latest ICASSP,
  59. look for papers by Johnston and Fereirra, Davidson et al, Singh,
  60. and others.  The Johnston paper was submitted late, it's on the
  61. last four pages of the audio book.
  62. -- 
  63. Extremism *Copyright alice!jj 1992, all rights reserved, except transmission
  64.    in the    *by USENET and like facilities granted.      Said permission is
  65.   defense of     *granted only for complete copies that include this notice.
  66.  liberty is no vice.  *Use on pay-for-read services specifically disallowed.
  67.