home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / unix / bsd / 10670 < prev    next >
Encoding:
Text File  |  1992-12-27  |  9.9 KB  |  191 lines

  1. Newsgroups: comp.unix.bsd
  2. Path: sparky!uunet!spool.mu.edu!darwin.sura.net!bogus.sura.net!pandora.pix.com!stripes
  3. From: stripes@pix.com (Josh Osborne)
  4. Subject: Re: S3 question - Amancio, are you there?
  5. Message-ID: <Bzy9wD.9Ez@pix.com>
  6. Sender: news@pix.com (The News Subsystem)
  7. Nntp-Posting-Host: pandora.pix.com
  8. Organization: Pix Technologies -- The company with no adult supervision
  9. References: <VIXIE.92Dec26034105@cognition.pa.dec.com> <1992Dec27.081525.29228@netcom.com>
  10. Date: Mon, 28 Dec 1992 03:33:47 GMT
  11. Lines: 178
  12.  
  13. In article <1992Dec27.081525.29228@netcom.com> hasty@netcom.com (Amancio Hasty Jr) writes:
  14. >In article <VIXIE.92Dec26034105@cognition.pa.dec.com> vixie@pa.dec.com (Paul A Vixie) writes:
  15. [...]
  16. >>I see that the two greatest bit-bangers of the average computer are available
  17. >>as VESA cards: display, and disk.  I'm still formulating my disk controller
  18. >>questions and perhaps I'll ask them in a future post.  Right now I'm trying
  19. >>to solve the S3 mystery.
  20.  
  21. One problem with VESA LB and disk drives, (I think) VESA LB doesn't allow
  22. bus mastering cards.  For SCSI (at least) this could be quite useful.  Of
  23. corse with current tech disk drives you need 3 fast disks running at once
  24. to use all the ISA bus.  Or you need (say, IDE) controlers with cache on them,
  25. but it would be better to have a auto-sizing disk cache in main memory (like
  26. SunOS, or Linux), because it would be (a) faster, and (b) useable as core if
  27. thats more useful then disk cache, (c) you know if it is flushed to disk 
  28. or not.
  29.  
  30. >>At work I have a EISA/SVGA/34020 board.  It is very fast when run under
  31. >>Windows 3.1; however, Microsoft had access to the 34020 specs and I don't,
  32. >>so I can't figure out how to port the X server to it and noone in this
  33. >>newsgroup seems to have done that either.  It's too bad -- a 34020 with
  34. >>a minimal BITBLT interpreter downloaded into it would make for a lightening
  35. >>fast X11 server with the 34020 as almost a co-processor.  However, I'm
  36. >>fairly sure that the 34020's days are numbered given something called "S3"
  37. >>and the "GUI Accelerator" that seem to be taking the market by storm.
  38.  
  39. The 34020 docs are available from TI, I have a set somewhere.  The cross 
  40. compiler is quite expensiave, and the old version makes poor code.  Someone
  41. got a old gcc to work (more or less) with it.  The 34020 is fairly quick,
  42. I would like to see a 34020 running X on it :-)  (I know it would be faster
  43. to do most of the X stuff on the [34]86 and let the TI bang bits).
  44.  
  45. The GUI accel's are doing better then the 34020 cards because they are cheap,
  46. however I think you can build a 34020 card as cheap as a S3, but nobody has.
  47.  
  48. >>I know that SVGA is more or less a hack on the IBM VGA spec to allow more
  49. >>pixels; what I don't know is what an "SVGA S3" is.  I have gathered from
  50. >>context in posts on this newsgroup that it is some kind of graphics
  51. >>accelerator chipset and that there are several different revisions of
  52. >>it and that different board manufacturers have had different results.
  53. >>Yet, VGA is fundamentally a frame buffer that has some hardware assist
  54. >>for certain operations.  Where does S3 fit in?  Is it another IO port, or
  55. >>just more opcodes to the existing VGA IO port?  Or just a faster implementation
  56. >>of the VGA spec?
  57.  
  58. This is answered well below, but I thought I would point out that:
  59.  * VGA only allows 64K of the video memory to be mapped into the PC's addr space
  60.  at once
  61.  * Most SVGAs allow 128K at once, normally 2 64K windows.
  62.  * Some more useful, but more disgusting ways of viewing video memory are also
  63.  available.
  64.  * A small number of SVGA chipsets can map all of the video memory into the
  65.  PC, but I don't know if the video cards can do it.  The 386BSD kernal will
  66.  need to be wacked to make it work anyway.
  67.  * The S3 adds a bunch of IO addrs on top of a normal looking SVGA chipset.
  68.  
  69. >>There are two reasons I need to know this.  First, if the VGA really is "just
  70. >>a frame buffer", then given a fast CPU and VESA it should be trivial to get
  71. >>the MIT CFB server running and have it run near the theoretical maximum
  72. >>(though at some potentially unneccessary cost in main CPU cycles).  If on
  73. >>the other hand VGA is like EGA in that you can only map certain parts into
  74. >>memory at a time and it's generally cheaper to send high-level commands and
  75. >>let the graphics hardware figure out how to achieve them, then I see a
  76. >>problem.
  77.  
  78. In genneral you can only map part of the video memory at a time.
  79.  
  80. >>What problem?  Well, DEC did this really neat thing called the "Dragon" chip
  81. >>set back on their MicroVAX II/GPX.  It was really really fast -- if you wrote
  82. >>your application in FORTRAN on VMS.  On the other hand if you ran under X11,
  83. >>things ran doggishly slow and the visual results were often less than perfect.
  84. >>This is because the _only_ way to talk to a Dragon is in high-level op-codes,
  85. >>and the model X11 lived in was incompatible with the one the Dragon used --
  86. >>so achieving one X11 operation often took several, or hundreds, of Dragon
  87. >>operations.  Since the Dragon's speed came from its economy of scale, the
  88. >>speed was less than amazing.
  89.  
  90. I don't know much about the dragon (is that the hardware made out of N 
  91. vipers?), but the S3, Mach8, Mach32, and even the 8514/a (or whatever it is)
  92. have accel for short line segments which I think match up quite well with
  93. the MI code in DDX's use of "spans" (not 100% short lines have limited length,
  94. spans do not), so even when the exact graphics command X wants is not supported
  95. by the hardware, this is (and should be faster then just pushing bits onto
  96. a dumb buffer, except for really small spans).
  97.  
  98. [...]
  99. >>So here comes S3.  Is it the salvation to all the world's woes?  That depends.
  100. >>Given VESA, one can access the VGA's "array" at memory speed (barring refresh
  101. >>stalls -- that whole thing isn't dual-ported, is it?).  Is that enough?  Or,
  102. >>if not, is it the S3 that gives one the extra performance and/or op-codes that
  103. >>make X11 sing?  And, if that last is true, why isn't an S3 on EISA or even ISA
  104. >>"fast enough" ?
  105.  
  106. I *think* (someone *please* correct me if I am wrong!) most of the numbers
  107. (even the 70k+ ones) were with ISA S3 cards (they may have been in a EISA
  108. system 'tho).
  109.  
  110. [...now the Hasty-miester speekith...]
  111. >The image write, read and fill operations' performance was increased by
  112. >using vga banking.We experienced a 10x performance improvement when 
  113. >we switched to vga banking. In the 8514/a architecture, all data transfer
  114. >between the cpu and co-processor is done via the data transfer register.
  115. >Also, we have to transfer the images a line at time inside a loop.
  116. >If there is one area in which the S3 architecture suffers this is it!
  117. >Ideally, I would like to see the chip do dma transfers from memory
  118. >to the card and have it calculate the offsets into its memory and 
  119. >the logical converse - have the chip  transfer a block of memory
  120. >to consecutive region in the hosts memory.
  121.  
  122. How about XCopyPlane (in XOR mode)?  I don't have a S3 card (yet), but thats
  123. the single most important thing for my application...
  124.  
  125. [...]
  126. >The 801/805 and 928 architectures are capable of mapping their entire video
  127. >memory to the host's address space. Currently, we only map 64k bytes at a
  128. >time. This limitation is mostly imposed to us by the kernel!
  129.  
  130. Can the video cards do this?  I assume the problem w/ the kernal is allocating
  131. physicly contigous RAM?  The best way to do this is add a new flag to the
  132. memmory allocator.  The simplest way is to have the device probe allocate the
  133. VM you need during boot when most allocations will be contigous, confirm that
  134. is _is_ contigous and go on...
  135.  
  136. >Further performance improvements were achieved by compiling the server
  137. >with gcc-2.3.1. Some of the x11perf results were nearly twice as fast!
  138. >Overall performance improvement, using xbench, proved to be around %15.
  139.  
  140. Did you remember to use -m 486 (to produce code that runs fast on the 486,
  141. but still runs on the 386), or just have it do 386 code?
  142.  
  143. [...]
  144. >Slowly, the server is evolving from its pure 8514/a architecture to the
  145. >S3 architecture. The next major jump will be when 16 bit or 24 bit
  146. >color gets implemented :-)
  147.  
  148. I thought the next big jump would be when you can map in 1+M of video memory
  149. and use it...
  150.  
  151. [...]
  152. >Next, is how does the S3 architecture fair agains other accelerated cards?
  153. >
  154. >The January issue of Byte magazine voted the Actix's GraphicEngine32 (801)
  155. >as one of the best overall graphic accelarated cards for window applications.
  156. >At least on Byte's tests the 801 was faster than the ATI Ultra Pro (mach 32).
  157. >And, I really doubt that the tests were executed at low clock frequencies.
  158. >However, the article did not state the dot clock frequency which the tests 
  159. >were executed at.  The other faster cards were based on the 34020 and cost
  160. >more than $1400.
  161.  
  162. People have had the S3 for long enough to make good use of it, the Mach32 may
  163. be too new for good drivers to be available yet.  If people decide that the
  164. 34020 cards don't need to emulate SVGA/EGA/CGA/Herc in hardware the price
  165. should drop by more then $1000, if they insist on doing that the price may
  166. drop by about $1000.  This would be the best card for X, because the 34020
  167. is fully programable and can be made more X orientated then windows orientated.
  168.  
  169. Also, the 340xx has super great control over the display (size/shape/res/
  170. borders).  The 34020 can even use the VRAM serial write regs...
  171.  
  172. [...]
  173. >On the topic of local bus IDE cards:
  174. >
  175. >It takes about 6 and 50 seconds to recompile the kernel with  gcc-1.39.
  176. >With an ISA IDE card, it takes about 7.5 minutes :-)
  177. >
  178. >How much does it cost? $89.
  179.  
  180. What does "6 and 50 seconds" mean?  Most IDE local bus cards mainly add lots
  181. of cache.  We can do better by adding more RAM to the main system and using
  182. it wisely...
  183.  
  184. [...]
  185. -- 
  186.            stripes@pix.com              "Security for Unix is like
  187.       Josh_Osborne@Real_World,The          Multitasking for MS-DOS"
  188.       "The dyslexic porgramer"                  - Kevin Lockwood
  189. We all agree on the necessity of compromise.  We just can't agree on
  190. when it's necessary to compromise.       - Larry Wall
  191.