home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #27 / NN_1992_27.iso / spool / comp / sys / next / sysadmin / 6619 < prev    next >
Encoding:
Internet Message Format  |  1992-11-20  |  3.7 KB

  1. Path: sparky!uunet!zaphod.mps.ohio-state.edu!menudo.uh.edu!menudo.uh.edu!usenet
  2. From: sears@tree.egr.uh.edu (Paul S. Sears)
  3. Newsgroups: comp.sys.next.sysadmin
  4. Subject: Re: NFS problems
  5. Date: 20 Nov 1992 15:29:27 GMT
  6. Organization: University of Houston
  7. Lines: 65
  8. Message-ID: <1ej08nINNdrn@menudo.uh.edu>
  9. References: <1992Nov20.125808.3461@email.tuwien.ac.at>
  10. Reply-To: sears@tree.egr.uh.edu
  11. NNTP-Posting-Host: thanatos.egr.uh.edu
  12.  
  13. In article <1992Nov20.125808.3461@email.tuwien.ac.at>  
  14. rainer@ruble.fml.tuwien.ac.at (Rainer Staringer) writes:
  15. =>I have an annoying problem that (so it seems to me) started after we
  16. =>upgraded two of our NeXTs to 3.0 and started using one of them as an
  17. =>NFS server.
  18. =>
  19. =>In random intervals (approx 1/day) all the machines in our little network
  20. =>(2 NeXTs running 2.1, one of them serving /Users and /usr/spool/mail,
  21. =>2 NeXTs running 3.0, one of them serving /LocalApps and /usr/local) will
  22. =>hang with the 'NFS server xxx not responding' message. Sometimes the
  23. =>problem goes away, sometimes you have to reboot the servers, sometimes
  24. =>one of the machines will panic. I found the following in /usr/adm/messages
  25. =>(ruble/mailhost/128.130.167.130 is the 2.1 server, moolah is the 3.0  
  26. server):
  27. =>
  28. =>Nov 20 13:31:25 moolah mach: NFS server ruble not responding still trying
  29. =>Nov 20 13:31:29 moolah mach: nfs_server: bad sendreply from 128.130.167.130
  30. =>Nov 20 13:31:36 moolah last message repeated 2 times
  31. =>Nov 20 13:31:42 moolah mach: NFS server mailhost not responding still trying
  32. =>Nov 20 13:31:44 moolah mach: nfs_server: bad sendreply from 128.130.167.130
  33. =>Nov 20 13:32:02 moolah mach: nfs_server: bad sendreply from 128.130.167.130
  34. =>Nov 20 13:33:42 moolah last message repeated 9 times
  35. =>
  36. =>The panic happened here (said something about ns_timeout table overflow).
  37. =>
  38. =>Nov 20 13:33:57 moolah syslogd: going down on signal 15
  39. =>Nov 20 13:34:51 moolah mach: Killing all processes NFS server ruble ok
  40. =>Nov 20 13:34:51 moolah mach: 
  41. =>Nov 20 13:34:51 moolah mach: continuing
  42. =>Nov 20 13:34:51 moolah mach: unmounting / ... done
  43. =>Nov 20 13:34:51 moolah last message repeated 4 times
  44. =>Nov 20 13:34:51 moolah mach: unmounting /Users ... done
  45. =>Nov 20 13:34:51 moolah mach: unmounting /server ... done
  46. =>Nov 20 13:34:51 moolah mach: unmounting / ... done
  47. =>Nov 20 13:34:51 moolah mach: unmounting /nn ... done
  48. =>Nov 20 13:34:51 moolah mach: unmounting / ... done
  49. =>Nov 20 13:34:51 moolah mach: unmounting / ... done
  50. =>Nov 20 13:34:51 moolah mach: rebooting Mach...
  51. =>
  52. =>Does anybody have a hint what could be causing this?? It really starts to
  53. =>get annoying, and I have not the slightest idea what we did wrong.
  54. =>
  55. =>    Rainer
  56. =>--
  57. =>Rainer Staringer                   | rainer@fml.tuwien.ac.at
  58. =>Financial Markets Lab, TU Vienna   | +43 (1) 58801/8138
  59.  
  60. This sounds like the problem we were having here for awhile.  First, do a "ps  
  61. -aux" on your servers when your clients get the NFS server not responding  
  62. message.  See which process is using up the most cpu.  My hunch is that  
  63. lookupd might be the culprit.  It this is indeed the case, then your problem  
  64. most likely involves netgroups, if you are using them.  Please post more  
  65. information about your problem.
  66.  
  67. When the server panicked, there should have been a reason for the panic in the  
  68. little window.  It is very helpful to post the panic messages so we have a  
  69. better idea of what was going on.  
  70.  
  71. --
  72. Paul S. Sears                *  sears@uh.edu (NeXT Mail OK)
  73. The University of Houston    *  suggestions@tree.egr.uh.edu (NeXT
  74. Engineering Computing Center *  comments, complaints, questions)
  75. NeXT System Administration   *  DoD#1967 '83 NightHawk 650SC 
  76.           >>> SSI Diving Certification #755020059 <<<
  77. "Programming is like sex: One mistake and you support it a lifetime."
  78.