home *** CD-ROM | disk | FTP | other *** search
/ ProfitPress Mega CDROM2 …eeware (MSDOS)(1992)(Eng) / ProfitPress-MegaCDROM2.B6I / APPS / STATISTI / TS2ST19.ZIP / STATREGR.INF < prev    next >
Encoding:
Text File  |  1990-12-23  |  11.9 KB  |  237 lines

  1.                            - 1 -
  2. 23rd December, 1990
  3.  
  4. About TS2ST in General  (Multiple regression analysis)
  5. ======================
  6.  
  7. Apply question mark ? with the program call for a brief description of a
  8. program.
  9.  
  10. This package may be used and distributed freely for NON-COMMERCIAL,
  11. NON-INSTITUTIONAL, PRIVATE purposes, provided it is not changed in any way.
  12. ┌────────────────────────────────────────────────────────────────────────────┐
  13. │ For ANY other usage (such as use in a business enterprise or a university) │
  14. │ or the full scale version contact the author for a personal or a site      │
  15. │ license.                                                                   │
  16. └────────────────────────────────────────────────────────────────────────────┘
  17. Please do not distribute any part of this package separately. Uploading to
  18. BBSes is encouraged.
  19.  
  20. The registered version is strictly for the registrant only. Identical
  21. programs must NOT be running on more than one computer at a time. Site
  22. licensed programs must not be run outside the licensed site.
  23.  
  24. The programs are under development. Comments and contacts are solicited. If
  25. you have any questions, please do not hesitate to use electronic mail for
  26. communication.
  27. InterNet address: ts@chyde.uwasa.fi         (preferred)
  28. Funet address:    GADO::SALMI
  29. Bitnet address:   SALMI@FINFUN
  30. FidoNet address:  2:515/1 (Micro Maniacs Opus, To: Timo Salmi)
  31.  
  32. The author shall not be liable to the user for any direct, indirect or
  33. consequential loss arising from the use of, or inability to use, any program
  34. or file howsoever caused. No warranty is given that the programs will work
  35. under all circumstances.
  36.  
  37. Timo Salmi
  38. Professor of Accounting and Business Finance
  39. School of Business Studies, University of Vaasa
  40. P.O. BOX 297, SF-65101 Vaasa, Finland
  41.  
  42. CONTENTS:
  43.  
  44.   1. Acknowledgements
  45.   2. General Description
  46.   3. Release Notes
  47.   4. The Statistics Set for Other Computers
  48.  
  49.                            - 2 -
  50.  
  51.  
  52. 1. ACKNOWLEDGEMENTS
  53.  
  54.    In developing and testing multiple regression programs for the VAX 11/750
  55. during 1983-86 I have had many useful discussions with my colleague Martti
  56. Luoma (Associate Professor of Statistics). This has directly benefited
  57. programming the current STATREGR program for PC compatibles.
  58.    I have also had useful suggestions from Antti Kanto (Acting Associate
  59. Professor of Statistics) in developing STATREGR.
  60.  
  61.  
  62. 2. GENERAL DESCRIPTION
  63.  
  64. STATREGR (Ver 1.8)
  65.  
  66.    STATistics: multiple REGRession analysis is part of the interactive
  67. statistical system by Timo Salmi. It is the second program in the set.
  68. The first program in the set is STATistical MEASures (STATMEAS in
  69. TS1STxx.ARC), which is intended for univariate analysis. The third program
  70. in the set is STATistics: TRANsformations (STATTRAN in TS3STxx.ARC), which
  71. can be used for transforming the observations, and, if necessary, also as an
  72. editor. The fourth program in the set is STATistics: Ranks and CORrelations
  73. (STATRCOR in TS4STxx.ARC). The fifth program in the set is STATistics: Least
  74. Absolute Deviation multiple Regression (STATLADR in TS5STxx.ARC).
  75.  
  76.    STATREGR includes a handy built-in help system, which can be invoked by
  77. typing ? at any interactive question. Because of this built-in help, and the
  78. interactive nature of the program's user interface, no long-winding
  79. instructions have been included. (Who reads instructions anyhow?)
  80.  
  81.    The program performs and ordinary least squares (OLS) multiple regression
  82. analysis, that is, estimates the coefficients of
  83.         Y = a + b(1)X(1) + ... + b(M)X(M)
  84. from a set of observations. Furthermore, it draws (or rather writes)
  85. low-resolution scatter diagrams of the data, and the regression analysis.
  86.  
  87.   The data can either be given from the keyboard or taken from a file. If the
  88. input is to be taken from a file it must first be prepared with some editor,
  89. or some word processor which includes an option for preparing ordinary ascii
  90. text. (Also STATTRAN can be used for this purpose.)
  91.    The data is given to the program in the following format:
  92.  
  93.        X1 X2 X3                    !variable names (! denotes a comment)
  94.        3.56 6.32 -1.73
  95.        5.12 -4.21 9.18
  96.        14.2 5.11 0.31
  97.        END                         !END is optional in a file
  98.  
  99. A missing item in an observation is marked by a hash (#). E.g. if the first
  100. item of the second observation were missing, the observation should be
  101. written as  # -4.21 9.18
  102.    The items in an observation can be separated with blanks, as in the above,
  103. or with commas (,) e.g. 5.12,-4.21,9.18. The number of the intervening
  104. blanks is irrelevant, and can be customized for increased readability. Thus
  105. e.g. 5.12 -4.21 9.18 and    5.12    -4.21     9.18    are equivalent.
  106.    A row can be continued using an ampersand (&). E.g. the variables could
  107. be given as
  108.        X1 X2 &
  109.        X3
  110. Alternatively, * or \ can be used instead of & as the continuation marker.
  111.  
  112.    Comments can be added to the input data. If ! appears on a line all text
  113. after ! will be considered as a comment.
  114.  
  115.    A header can be entered on each page if output is directed to a file.
  116. To accomplish this start the very first line on the input file with a
  117. double exclamation mark (!!) and the rest of the line will be used as the
  118. header. Thus !! indicates a header, a single ! an ordinary comment.
  119.  
  120.    The maximum number of variables is 25. The maximum number of observations
  121. is 400 (for each variable). The public domain version, however, sets the
  122. limits at 4 and 100 respectively.
  123.  
  124.  
  125. 3. RELEASE NOTES
  126.  
  127.    Version 1.1 of STATREGR includes some minor changes and corrections in the
  128. user interface.
  129.  
  130.    Version 1.2 of STATREGR introduces CGA high-resolution diagrams for the
  131. analysis. Unlike the low-resolution text-mode diagrams, the high-resolution
  132. diagrams will always be drawn on the screen. (In the former case, directing
  133. the output to a file is also possible).
  134.  Further overflow checks have been added to prevent the program crashing
  135. because of bad data.
  136.  Multiple regression estimates are based inverting a cross-product matrix
  137. of the observations. If the explaining variables are very similar
  138. (multicollinearity), the matrix will be nearly singular, and the estimates are
  139. very unstable. Further problems of significance can arise if the values of the
  140. explaining variables are of a very different scale. To test the reliability of
  141. the estimation results the cross-product matrix is multiplied by its computed
  142. inverse, and the result compared with a unit matrix, and the sum of absolute
  143. deviations is reported as ABS DEVIATION FROM UNIT MATRIX. The smaller this
  144. figure, the less probability of computationally weak estimates. Although
  145. seldom reported, this problem is inherent to most (even the top commercial)
  146. statistics packages.
  147.  If the input file is not found, you have the choice of listing directories
  148. from within STATREGR. The directory routine has been rewritten for a more
  149. relaxed syntax. (For details see the information on DIRW in TSUTIL.INF in
  150. TSUTILxx.ARC version 1.8 or later.)
  151.  
  152.    In version 1.3 the program no longer crashes from an attempt to rewrite a
  153. write-protected file. Second, the user now has more control over the choice
  154. of the graphics driver in the high-resolution scatter diagrams. Apply ? at
  155. the question "USE CGA GRAPHICS DRIVER" for more information. Third, the
  156. t-values of the residuals have been included in the tableau giving the
  157. regressed values.
  158.  
  159.    In version 1.4 the program has been recompiled with some minor changes.
  160.  
  161.    Version 1.5:  This version introduces input recall and line editing. The
  162. special keys Del, CrLf, CrRg, CrUp, Home, End, and Esc are functional for
  163. this purpose. PgUp is the recall key. Line editing uses insert mode.
  164.  Disk access has been made faster (the program has its own cache).
  165.  The directory routine has been updated.
  166.  Read-only files can be read properly.
  167.  The program size has been reduced by limiting the graphics to CGA, EGA, and
  168. VGA.
  169.  
  170.    Version 1.6: In compiling version 1.5 I made in error in setting the
  171. default heap size. This caused an out of memory condition, which now has been
  172. remedied. In line editing the Insert key has been made functional.
  173.  
  174.    Version 1.7: The regression line in the high resolution scatter diagram
  175. was incorrectly drawn for negative regression coefficients. My thanks are due
  176. to acting associate professor Roy Dahlstedt for pointing it out.
  177.  
  178.    Version 1.8: The line editing potential of the program has been improved.
  179. When the task is given from the keyboard, and continuation lines are used,
  180. the repeated input recall (CursorUp) gets each line in turn. Ctlr-C and
  181. break-key abort have been enhanced.
  182.  A line can be continued using an &, or a * at the end. Now also the
  183. backslash \ is accepted.  This was suggested by Tuomas Eerola.
  184.  Some help texts within the program have been extended.
  185.  Multiple regression estimates are based inverting a cross-product matrix of
  186. the observations. If the explaining variables are very similar (multi-
  187. collinearity), the matrix will be nearly singular, and the estimates are very
  188. unstable. Further problems of significance can arise if the values of the
  189. explaining variables are of a very different scale. To test the reliability
  190. of the estimation results the cross-product matrix is multiplied by its
  191. computed inverse, and the result compared with a unit matrix, and the square
  192. root of the sum of the squared deviations is reported as DEVIATION FROM UNIT
  193. MATRIX. (Earlier I used the sum of absolute deviations, but the norm, that is
  194. the square root of squared deviations, is theoretically better, since it can
  195. be cosidered the length of the deviation vector.) The smaller this figure,
  196. the less probability of computationally weak estimates. Although seldom
  197. reported, this problem is inherent to most (even the top commercial)
  198. statistics packages.
  199.  Found and corrected an annoyingly elusive bug, that caused problems if the
  200. last observation in the data had items with more digits than 10.
  201.  
  202.    Version 1.9: Several improvements to the nuts and bolts of the user
  203. interface.
  204.    The new usage of the call is
  205. PROGNAME [/h(elp)] [/iInputFileName] [/oOutputFileName] [/cColumnsPerRow]
  206. (the /c option, which regulates the width of the output, is for registered
  207. versions, only). If you use the /i switch, it stuffs the InputFileName into
  208. the appropriate recall buffer. This means that when the program asks you for
  209. the input file name, you can invoke the input file name just by pressing the
  210. CursorUp key. (The same goes for the /o switch, respectively.) This is very
  211. convenient, if you use the program many times successively making small
  212. changes in your data in between. (This assumes, of course, that you have a
  213. command line editor like DOSEDIT or CED to recall previous MsDos commands.
  214. These common shareware programs can be obtained from any well-stocked BBS or
  215. FTP site.)
  216.    The printer readiness test has been rewritten to be more general. The
  217. earlier test failed for some printers, because the codes the printers send
  218. when they are offline are not standardized.
  219.    The "file exists, overwrite?" question is no more asked when the output
  220. file is prn, in other words when the output is directed to the printer.
  221.    The user has now a choice of a left margin from 0 to 20 blanks when output
  222. is directed to the printer.
  223.    The user has now a choice between formfeed and four blank lines to start
  224. each new page of output.
  225.    When an input file is not found, the user is given the choice of listing a
  226. directory. The directory routine has been rewritten.
  227.    The file ready message now also includes the file side besides the name.
  228.  
  229.  
  230. 4. THE STATISTICS SET FOR OTHER COMPUTERS
  231.  
  232.    The Statistical programs by Timo Salmi are also available for the Sinclair
  233. QL computer. Named STATPREP the system is part of a Public Domain library for
  234. QUANTA members. The descriptions of the files in the Quanta Library are given
  235. in STATMEAS.INF contained in TS1STxx.ARC, i.e. the first part of the set
  236. statistical programs.
  237.