home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / sys / sgi / hardware / 52 < prev    next >
Encoding:
Internet Message Format  |  1993-01-03  |  2.8 KB

  1. Path: sparky!uunet!spool.mu.edu!olivea!sgigate!odin!fido!zola!zuni!anchor!olson
  2. From: olson@anchor.esd.sgi.com (Dave Olson)
  3. Newsgroups: comp.sys.sgi.hardware
  4. Subject: Re: SCSI disk problem
  5. Message-ID: <ue43kko@zuni.esd.sgi.com>
  6. Date: 3 Jan 93 21:28:09 GMT
  7. References: <1993Jan2.150746.6429@sun1.ruf.uni-freiburg.de>
  8. Sender: news@zuni.esd.sgi.com (Net News)
  9. Organization: Silicon Graphics, Inc.  Mountain View, CA
  10. Lines: 48
  11.  
  12. In <1993Jan2.150746.6429@sun1.ruf.uni-freiburg.de> kleinren@sun1.ruf.uni-freiburg.de (Rainer Kleinrensing) writes:
  13. | After christmas we found that our 4D-220VGX had crashed in a mysterious way:
  14. | many programs of the OS could not be found any more, we had to reload 
  15. | the root partition from the last backup. In SYSLOG there were the following
  16. | messages:
  17. | Dec 27 03:13:19 gt unix: WARNING: dma_map: address not word aligned
  18. | Dec 27 03:13:19 gt unix: sc0,1,0: cmd=0x28 disconnected on non-word boundary (ad
  19. | dr=C046AE4F, 0x0 left)
  20. | Dec 27 03:13:21 gt unix: .  Resetting SCSI bus
  21.  
  22. In the case of disks, this is almost always a SCSI bus error of some
  23. sort (bad cable, loose connector, missing or extra terminators), since
  24. they almost always disconnect on a block boundary.
  25.  
  26. SGI's DMA hardware requires word (low 2 bits of address 0) aligned
  27. addresses to work; this message tells you that the disconnect was
  28. not on a word boundary.  The 0 left part is a bug in my code; it *always*
  29. prints 0 in some releases; I think I fixed it for 405, but it might
  30. have been 405F.
  31.  
  32. | Dec 27 05:02:12 gt unix: dks0d1s0 (/): Directory 13 is corrupted (4d)
  33. | Dec 27 05:02:13 gt unix: dks0d1s0 (/): inum: 19 illegal number of indirect exten
  34. | ts
  35. | Dec 27 05:02:13 gt unix: 
  36. | Dec 27 05:02:13 gt unix: dks0d1s0 (/): inum: 20 illegal number of indirect exten
  37.  
  38. This could be the result of cabling problems also, if bad data got written
  39. to disk.  It could also be a firmware problem with the drive.
  40.  
  41. | After restoring the backup everything worked just fine. However, a few
  42. | minutes ago I saw 
  43. | Jan  1 05:00:15 gt unix: dks0d1s6 (/usr/amandus): inum: 1724 illegal number of i
  44. | ndirect extents
  45. | Jan  1 05:00:15 gt unix: 
  46. | Jan  1 05:00:16 gt unix: dks0d1s6 (/usr/amandus): inum: 1725 illegal number of i
  47. | ndirect extents
  48. | in SYSLOG. Is this just a sign of the disk going bad (I admit it's no SGI disk,
  49. | but has workes flawlessly for at least 3 years now) or did we
  50. | inadvertently make some configuration or software error ?
  51.  
  52. Did you do either an mkfs or an fsck before doing the restore?  If so,
  53. either the drive is failing, or something has recently changed about
  54. the physical setup on the machine, that is affecting the SCSI bus.
  55. --
  56. Let no one tell me that silence gives consent,  |   Dave Olson
  57. because whoever is silent dissents.             |   Silicon Graphics, Inc.
  58.     Maria Isabel Barreno                        |   olson@sgi.com
  59.