home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / compress / 3863 < prev    next >
Encoding:
Internet Message Format  |  1992-11-17  |  2.3 KB

  1. Path: sparky!uunet!usc!cs.utexas.edu!qt.cs.utexas.edu!yale.edu!think.com!ames!agate!doc.ic.ac.uk!uknet!mcsun!sun4nl!ruuinf!accucx!nevries
  2. From: nevries@accucx.cc.ruu.nl (Nico E de Vries)
  3. Newsgroups: comp.compression
  4. Subject: Re: Need a compressor for sparse bit datastream
  5. Keywords: compression technique
  6. Message-ID: <3328@accucx.cc.ruu.nl>
  7. Date: 16 Nov 92 16:53:52 GMT
  8. References: <1992Nov13.120505.29654@spectrum.xerox.com>
  9. Organization: Academic Computer Centre Utrecht
  10. Lines: 28
  11.  
  12. In <1992Nov13.120505.29654@spectrum.xerox.com> richard@garfield.noname (richard_landells.sbd-e@rx.xerox.com) writes:
  13.  
  14. >I have an application that generates binary output.  The output is relatively random, but there are approximately twice as many off bits as on bits.  My objective is to compress this as much as possible.  
  15.  
  16. >I have tried several 'standard' compressors, arj 2.2, lharc, pkzip 1.1, and have only managed to achieve very minimal compression in the order of 4% at best (on a 40K file).  Now I know that a truly random binary datastream cannot be compressed, but I was kind of hoping for better than 4%.  Am I missing something fundamental, or is this really the best that can be achieved?  
  17.  
  18. >If there is a technique to compress this type of data, I would appreciate some pointers to some source code that implements it.
  19.  
  20. If the data is random but has two times more 0's than 1's use arithmetic
  21. compression. This achieves better compression than the 4% you mentioned.
  22. If there is some "logic" in the data (repeating patterns etc) you might
  23. considder e.g. higher order arithmetic compression. 
  24.  
  25. Something which also might work is converting bits to bytes. This makes the
  26. file 8 times larger but allows ARJ and PKZIP to do their job. Both are
  27. byte oriented. The resulting compressed file might become smaller than
  28. the compressed origional one.
  29.  
  30. >Richard Landells  (landells.sbd-e@rx.xerox.com)
  31. >Rank Xerox System Centre
  32.  
  33. Nico E. de Vries  (nevries@cc.ruu.nl) |------------------*   AA   III  PPP
  34. _ This text is supplied AS IS, no warranties of any kind |  A  A   I   P  P
  35. | apply. No rights can be derived from this text. This   |  AAAA   I   PPP
  36. | text is likely to contain spelling and grammar errors. |  A  A   I   P
  37. *---------------------------( Donate to GreenPeace! )----*  A  A  III  P
  38.  
  39. "The IBM PC is still waiting for a version of the CP/M OS.", G.M. Vose, 1982.
  40.