home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / os / vms / 20075 < prev    next >
Encoding:
Internet Message Format  |  1992-12-30  |  4.6 KB

  1. Path: sparky!uunet!elroy.jpl.nasa.gov!news.claremont.edu!nntp-server.caltech.edu!SOL1.GPS.CALTECH.EDU!CARL
  2. From: carl@SOL1.GPS.CALTECH.EDU (Carl J Lydick)
  3. Newsgroups: comp.os.vms
  4. Subject: Re: Mount verification timed out
  5. Date: 30 Dec 1992 12:38:22 GMT
  6. Organization: HST Wide Field/Planetary Camera
  7. Lines: 79
  8. Distribution: world
  9. Message-ID: <1hs57uINNnqs@gap.caltech.edu>
  10. References: <1992Dec29.152302.1716@das.harvard.edu>,<1992Dec29.105010.1@slacvx.slac.stanford.edu>
  11. Reply-To: carl@SOL1.GPS.CALTECH.EDU
  12. NNTP-Posting-Host: sol1.gps.caltech.edu
  13.  
  14. In article <1992Dec29.105010.1@slacvx.slac.stanford.edu>, fairfield@slacvx.slac.stanford.edu writes:
  15. =In article <1992Dec29.152302.1716@das.harvard.edu>, chen@speed.uucp (Lilei Chen) writes:
  16. => In our VAX/VMS-cluster a bunch of disks are cross mounted.  Somtimes when
  17. => a node goes down, its disks are marked mount verification timed out.  I
  18. => haven't found a way to get those disks remounted without rebooting the
  19. => nodes.  I am wondering if someone on the net has a solution for that problem.
  20. =
  21. =    For each node in the  cluster  for  which  the  disk(s) have gone into
  22. =mount verification time-out, do:
  23. =
  24. =    $ DISMOUNT/ABORT device
  25. =
  26. =You can do this most easily from SYSMAN after doing
  27. =
  28. =    SYSMAN> SET ENVIRONMENT/NODE=(NODE1,NODE2,...,NODEN)
  29. =
  30. =where the node  list,  above,  includes  all/only  those  nodes needing to
  31. =remount  the disk(s).  Follow the DISMOUNT with a MOUNT (with  appropriate
  32. =parameters).  Note that it _is_ allowed to do a  second  MOUNT/CLUSTER  of
  33. =the  device in question from it's local host (and perhaps from any node in
  34. =the cluster, I haven't tried): all  nodes  for which the device is already
  35. =mounted ignore the request, while nodes that don't have the device mounted
  36. =will mount it.
  37. =
  38. =    As another followup pointed out, if there are any open channels to the
  39. =disk(s) that "went away", they must  be  closed  before the disk(s) can be
  40. =dismounted.   That's  why  you need to use /ABORT.  I am not sure  of  the
  41. =current situation (VMS V5.5-1), but in earlier versions  of  VMS,  if  you
  42. =issued  a  DISMOUNT to the device _without_ the /ABORT qualifier, the disk
  43. =would  NOT  dismount  successfully,  even  if  you  subsequently  issued a
  44. =DISM/ABORT (again, this is most likely dependent on having "open" files on
  45. =the device in question from the node you're trying to do the dismount).  I
  46. =recall  getting devices into a state of "Mount/Dismount"!  The only way of
  47. =recovering those devices for _that_ node was to reboot. :-(
  48.  
  49. At last!  An intelligent and responsible answer to the question.  Several other
  50. responses recommended actions that would've only made matters worse.
  51.  
  52.     PLEASE:  WHEN ANSWERING QUESTIONS IN THIS NEWSGROUP, DON'T GIVE ANSWERS
  53.         UNLESS YOU'VE TESTED THEM!
  54.  
  55. I've held off on answering because, though I thought I knew the answer, I knew
  56. that some actions would certainly make things worse (once you've got a disk in
  57. the state "Mounted, marked for dismount" you can be in *REAL* trouble;  there's
  58. no simple way to figure out who's got what open;  at best, you can use
  59. ANALYZE/SYSTEM on each node in your cluster and check EVERY process's channel
  60. listings to figure out who's got channels open).
  61.  
  62. FWIW, here's what the HELP utility (those of you who gave harmful answers HAVE
  63. heard of HELP, haven't you?) has to say about DISMOUNT/ABORT:
  64.  
  65. $ HELP DISMOUNT/ABORT
  66.  
  67. DISMOUNT
  68.  
  69.   /ABORT
  70.  
  71.      Requires volume ownership or the user privilege VOLPRO (volume
  72.      protection) to use this qualifier with a volume that is mounted
  73.      neither group nor system.
  74.  
  75.      Specifies that the volume is to be dismounted, regardless of who
  76.      mounted it. The primary purpose of the /ABORT qualifier is to
  77.      terminate mount verification. The DISMOUNT/ABORT command also
  78.      cancels any outstanding I/O requests. If the volume was mounted
  79.      with the /SHARE qualifier, the /ABORT qualifier causes the volume
  80.      to be dismounted for all of the users who mounted it.
  81.  
  82. The idiots who suggested using DISMOUNT without the /ABORT qualifier apparently
  83. didn't know (or care) that DISMOUNT without that qualifier can put the disk
  84. into a state where outstanding I/O requests *CANNOT* be canceled.
  85. --------------------------------------------------------------------------------
  86. Carl J Lydick | INTERnet: CARL@SOL1.GPS.CALTECH.EDU | NSI/HEPnet: SOL1::CARL
  87.  
  88. Disclaimer:  Hey, I understand VAXen and VMS.  That's what I get paid for.  My
  89. understanding of astronomy is purely at the amateur level (or below).  So
  90. unless what I'm saying is directly related to VAX/VMS, don't hold me or my
  91. organization responsible for it.  If it IS related to VAX/VMS, you can try to
  92. hold me responsible for it, but my organization had nothing to do with it.
  93.