home *** CD-ROM | disk | FTP | other *** search
/ The Datafile PD-CD 4 / DATAFILE_PDCD4.iso / utilities / utilst / unpost / !Unpost / doc / Summary < prev    next >
Encoding:
Text File  |  1995-10-02  |  6.7 KB  |  155 lines

  1. UNPOST Version 2.1.0
  2.  
  3. More bug fixes, documentation updates, a new configuration file, etc.
  4.  
  5. UNPOST is a "smart" uudecoder that is designed to extract binaries from
  6. multi-part USENET or email uuencoded binaries.
  7.  
  8. Features:
  9.  
  10. 1)  PORTABILITY!  UNPOST has been compiled and sucessfully run on
  11.     MS-DOS, OS/2, Windows, Unix workstations, MacIntoshes, Amiga's
  12.     and VAX/VMS systems.
  13.  
  14.     The code is written to be pure ANSI C, within reasonable limits.
  15.     (some ANSI C capabilities are not used where they would be
  16.     appropriate due to lagging compliance in most compilers.  Hey,
  17.     Unix types!  MS-DOS (Borland C++ 3.1) is a MUCH better compiler
  18.     than anything I've seen on a Unix workstation!  And their debugger
  19.     is the best I've used, as well).  Unfortunately, there are still
  20.     a lot of Unix boxes that have only a K&R compiler, so it may
  21.     not port well to those.  I personally check to make sure that it
  22.     will compile and run on an MS-DOS box running MS-DOS 5 and Windows
  23.     3.1, using the Borland 3.1 C++ compiler, as well as a Sun (running
  24.     SunOs 4.1.1 sun4c) using the gcc compiler (version 2.1).  I know
  25.     for a fact that the Sun cc compiler will NOT compile UNPOST
  26.     succesfully.
  27.  
  28.     K&R compatibility is being considered, but it is a low priority
  29.     feature.
  30.  
  31. 2)  CONFIGURABILITY!  UNPOST comes with a default set of rules for
  32.     detecting and parsing a VERY wide range of possible Subject:
  33.     line formats, but no configuration can be correct for every
  34.     situation.
  35.  
  36.     With that in mind, UNPOST can be configured by the user by creating
  37.     a text file that contains the regular expressions, etc. that
  38.     UNPOST uses to recognize, parse, etc.  WARNING!  UNPOST depends
  39.     almost ENTIRELY on the contents of it's configuration file for
  40.     correct operation.
  41.  
  42.     Regular expressions are complex, and writing one that works the
  43.     way you expect it to takes care and, most importantly,
  44.     experimentation.
  45.  
  46.     To this end, the standard UNPOST installation creates both the
  47.     UNPOST executable and a regular expression test program called
  48.     RETEST.  RETEST is like grep, feed it a regular expression and
  49.     a file, and RETEST will tell you what it matched and the sub
  50.     strings that it extracted.
  51.  
  52. 3)  INTELLIGENCE!  UNPOST uses every trick in the book to try to
  53.     guess what the poster/sender REALLY meant.
  54.  
  55.     Also, UNPOST is not limited to finding all of it's information
  56.     on a single line, or even in the header of a posting/letter.
  57.  
  58.     UNPOST has succesfully extracted binaries from postings that had,
  59.     as a subject line,
  60.  
  61.     Subject: aaaa
  62.  
  63.     because UNPOST recognized the signature placed into the body of
  64.     the article by a uuencode/split program.
  65.  
  66. 4)  FLEXIBILITY!  UNPOST has switches that allow it to be configured
  67.     to do different things for different tastes.  For instance, UNPOST
  68.     will intelligently sort out articles into four different classes:
  69.  
  70.     1)  Articles that are part of a complete and correct binary in
  71.         the input file.  These are sorted, concatenated, uudecoded
  72.         and written out to a file name that is the same as that
  73.         on the uuencode begin line.
  74.  
  75.         Depending on the setting of the file name switch, the file
  76.         name of the binary may be modified.  See below.
  77.  
  78.     2)  Articles that are pure text (no uuencoded data in them).
  79.  
  80.         If the -t switch and a file name are specified, these
  81.         articles will be written out to the file for reading.
  82.  
  83.         Obviously, these articles should NEVER be encountered in
  84.         a binaries news group, but not a single day has ever gone
  85.         by that I did not see non-binary postings to binary news
  86.         groups.
  87.  
  88.     3)  Articles that are part of incomplete postings (four parts,
  89.         but only three have shown up so far), or that comprise
  90.         a complete binary, but one that had an error in uudecoding,
  91.         interpretation, etc.
  92.  
  93.         If the -i flag and a file name are specified, these articles
  94.         will be written out to the file.  If the -b switch is
  95.         on, incompletes will be written to separate files.  If
  96.         both are on, those incompletes that can be guessed at
  97.         as having a file name will be written to a separate file,
  98.         all else will be written to the file named by the -i
  99.         switch.
  100.  
  101.         In my experience, two types of articles end up in an
  102.         incompletes file, those that have missing parts, and
  103.         those that have been misinterpreted by UNPOST as belonging
  104.         to a different binary than they really do.
  105.  
  106.     4)  Articles that are pure text that describe a posting
  107.         (these are usually found only in the pictures groups).
  108.  
  109.         If the -d flag is set, and the binary to which they
  110.         belong is correct and complete, this article, as well as
  111.         the header and body up to the uuencode begin line of the
  112.         first article, will be written to a file that has the same
  113.         base name as the binary, but with the extension .inf.
  114.  
  115.     UNPOST automatically mungles binary file names to be MS-DOS
  116.     compatible (the lowest common denominator).  This is switch
  117.     controllable, and can be turned on or off (depending on the
  118.     default setting selected by the person who compiled UNPOST).
  119.  
  120.     UNPOST also has two lesser modes, sorted mode and uudecode mode.
  121.  
  122.     In sorted mode, UNPOST assumes that the articles still have
  123.     headers, and that there may be un-uuencoded lines in the middle
  124.     of a uuencoded file that have to be filtered out, but it assumes
  125.     that all parts are present, and that they are in order.  Header
  126.     information, however, is ignored.
  127.  
  128.     If you use the incompletes file capability of UNPOST, you will
  129.     notice that it writes out the segments that it did interpret
  130.     correctly in sorted order.
  131.  
  132.     In uudecode mode, UNPOST acts like a simple uudecoder.  UUencoded
  133.     files must be complete, with a begin and end line, and no
  134.     un-uuencoded lines can appear between the begin and end lines.
  135.  
  136.     However, uudecode mode is the ONLY mode where UNPOST will accept
  137.     a short line (one that was space terminated, but had the spaces
  138.     chopped off) as a legal uuencoded line and properly decode it.
  139.  
  140. 5)  INFORMATIVE!  UNPOST is a very talkative program.  It detects
  141.     and reports many kinds of problems, tells you what it thinks
  142.     is going on, and tells you what it is doing.  All this information
  143.     is written to standard error, or if the -e switch and a file
  144.     name are specified, written to that file.
  145.  
  146. Changes for UNPOST Version 2.1.2
  147. --------------------------------
  148.  
  149. 1)  Bug fix.  I screwed up the regular expression compilation for the
  150.         -r switch.  Fixed.  See note 5 for version 2.1.1 in the changes.doc
  151.         file for information on how to select one of four sources for your
  152.         news.
  153.  
  154. jstevens@csn.org
  155.