home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / unix / wizards / 4877 < prev    next >
Encoding:
Internet Message Format  |  1992-11-24  |  3.0 KB

  1. Path: sparky!uunet!olivea!spool.mu.edu!sol.ctr.columbia.edu!destroyer!ncar!vexcel!copper!slate!mbarkah
  2. From: mbarkah@slate.mines.colorado.edu (Ade Barkah)
  3. Newsgroups: comp.unix.wizards
  4. Subject: Re: Changing the owner of a process
  5. Message-ID: <1992Nov24.024750.22442@slate.mines.colorado.edu>
  6. Date: 24 Nov 92 02:47:50 GMT
  7. References: <1992Nov23.180757.20627@nuchat.sccsi.com>
  8. Organization: Colorado School of Mines
  9. Lines: 57
  10.  
  11. steve@nuchat.sccsi.com (Steve Nuchia) writes:
  12. : In article <1992Nov19.220759.1846@exlog.com> mcdowell@exlogcorp.exlog.com (Steve McDowell) writes:
  13. : >Why is it going to panic over an inconsistent process count? That's simply
  14. : >not good operating system design. When it hits an inconsistancy (as it
  15. : >eventually will in some remote region of the world) it should simply alert
  16. : >the operator and re-count things.
  17. : Three points:
  18. : 1: If you have enough free time on your hands, feel free to write
  19. : the necessary recounting code for all the places where the kernel
  20. : keeps counts.  I'd prefer to have the CSRG's remaining time spent
  21.  
  22. I agree with you there. However, I also agree with the previous 
  23. poster in that in the _commercial_ arena products should tend
  24. to be more rugged and recover if it could.
  25.  
  26. : 2: I may be old-fashioned, but I prefer to have a system panic
  27. : when it detects a "can't happen" bug.  That means something
  28. : has gone wrong.  Under those circumstances, why would you want
  29. : to trust a piece of recovery code that hasn't been tested in
  30. : living memory?
  31.  
  32. Because a panic() and shutdown may be inappropriate. Take some
  33. real time applications, for example, like piloting a plane. Boy
  34. I sure hope the computer wouldn't just panic on me if it can
  35. recover.
  36.  
  37. : 3: What is the opertator going to do about it, anyway?  If one of
  38. : these counts gets out of whack, somebody who can fix the code needs
  39. : to know about it, fast.  Something caused the fault, and there is
  40. : literally no telling what else may be broken until the cause is found.
  41.  
  42. That's for the operator to decide. He/she may immediately shutdown
  43. the system. Or continue at her own peril. Researchers can't always
  44. know what the product is going to be used for. While it is probably
  45. true that the large majority of people wouldn't be bothered with
  46. recoverable-panics, to some it would be disastrous.
  47.  
  48. : Of course, if one is building a system for binary-only distribution
  49. : or attempting to provide for non-stop operation, other considerations
  50. : apply.  BSD Unix does not have those design goals.
  51.  
  52. No questions there. I think most of us do know that we're talking
  53. about two kinds of worlds here, lab-research vs. commercial, and 
  54. the needs are sometimes mutually exclusive.
  55.  
  56. And lets leave it at that. In the lab time is much better spent
  57. doing something else. The commercial people have their own respon-
  58. sibility of providing what their clients want or need.
  59.  
  60. : Steve Nuchia      South Coast Computing Services, Inc.      (713) 661-3301
  61.  
  62. -Ade Barkah-
  63. -- 
  64. Internet  : mbarkah@slate.mines.colorado.edu    (NeXT Mailable)
  65. CompuServe: 74160,3404
  66.