home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / vmsnet / sysmgt / 451 < prev    next >
Encoding:
Internet Message Format  |  1993-01-28  |  8.0 KB

  1. Xref: sparky vmsnet.sysmgt:451 vmsnet.networks.misc:150 comp.os.vms:22071
  2. Path: sparky!uunet!stanford.edu!ames!saimiri.primate.wisc.edu!sdd.hp.com!swrinde!emory!gatech!destroyer!cs.ubc.ca!van-bc!jeslacs!psmode
  3. From: Peter Smode <psmode@jeslacs.wimsey.bc.ca>
  4. Newsgroups: vmsnet.sysmgt,vmsnet.networks.misc,comp.os.vms
  5. Subject: Re: Lost LAT sessions
  6. Message-ID: <L28ZXB1w165w@jeslacs.wimsey.bc.ca>
  7. Date: Tue, 26 Jan 93 13:54:32 PST
  8. Organization: JES Library Automation, Coquitlam BC, CANADA
  9. Lines: 179
  10.  
  11. This message is being cross-posted to vmsnet.sysmgt, comp.os.vms and
  12. vmsnet.networks.misc. Please post reposnses in vmsnet.sysmgt or e-mail
  13. the author.
  14.  
  15. People from WordPerfect Corp. are encourraged to read and respond to 
  16. this post (see below).
  17.  
  18. It would appear that this problem I have perviously described is alot 
  19. more widespread than I thought. I have received a number of responses 
  20. to my query; many from sites that have experienced this problem now or 
  21. in the past. For this  reason, I would like to return this discussion 
  22. to the group.
  23.  
  24. I summarize the problem again along with some of the latest information
  25. collected.
  26.  
  27. From time to time, we will get one or more interactive terminal sessions on 
  28. LTAxxxx: terminals getting "lost in space". We have not been able to 
  29. reproduce this problem in a controlled fashion. However, the affected 
  30. sessions show ALL of the following symptoms:
  31.  
  32.  
  33. - A SHOW USERS FULL will be missing the (server/port) address for the
  34. LTAxxx: terminal
  35. $ SH US /FU SEXSMITH
  36.       VAX/VMS User Processes at 25-JAN-1993 16:45:48.57
  37.     Total number of users = 1,  number of processes = 1
  38.  
  39.  Username     Node   Process Name    PID     Terminal
  40.  SEXSMITH_M    VAXB  SEXSMITH_M    20601743  LTA6716: 
  41.  
  42. - The process will INHALE all available CPU time, effectively turning the 
  43. system into a dog (it turns out the jobs are NOT at elivated priority; my 
  44. memory had failed me). Doing a SHOW PROCESS on the job shows that it is 
  45. locked in some sort of CPU loop, doing no I/O whatsoever; the job state is 
  46. always COM.
  47.  
  48. - The application running is one writen and supported by us. We have seen 
  49. two applications involved here, both written in VAX BASIC. One application 
  50. uses SMG exclusively for terminal I/O; the other simply invokes the PRINT 
  51. and INPUT verbs built into the VAX BASIC language.
  52.  
  53. - We have no reliable reports of what the physical terminal is displaying
  54.  
  55. - SHOW ERROR reveals nothing
  56.  
  57. - Happens for both direct and dialup connections on any port, any server, 
  58. DEC and non-DEC. One site uses a Vitalink bridge (with the problem appearing 
  59. on both sides); the other has nothing but a single Ethernet segment and a 
  60. number of terminal servers.
  61.  
  62. - The problem tends to happen during peak hours. We cannot recall, but 
  63. cannot rule out occurances during off-peak hours.
  64.  
  65. - A SHOW PORT LTAxxx command from LATCP shows that the port is inactive 
  66. and does not show the server/port name for the device. Even more 
  67. interesting is that the port type is indicated as 'Forward', with no 
  68. target service or actual service indicated. This port started out as an 
  69. interactive!
  70.  
  71. - Server error counters do not seem to indicate trouble. A SHOW PORT COUNT
  72. command on the server indicates some framing errors, but not an excessive
  73. number:
  74.      Current Counters for Port 19 qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
  75.     x 
  76.     x Seconds since zeroed: 1780534 (20 14:35:34)
  77.     x
  78.     x Port Statistics:                      Port Errors:
  79.     x   Local Accesses:           74          Framing:                 71
  80.     x   Remote Accesses:           0          Parity:                   0
  81.     x   Inactivity Logoff:         0          Overrun:                  0
  82.     x   Password Logoff:           0
  83.  
  84. - NCP counters do no show anything out of the ordinary. A SHOW EXECUTOR 
  85. COUNT display for one instance follows:
  86. Node Counters as of 25-JAN-1993 16:45:35
  87.  
  88. Executor node = 1.11 (VAXB)
  89.  
  90.       >65534  Seconds since last zeroed
  91.      1448613  Bytes received
  92.      1448396  Bytes sent
  93.        31035  Messages received
  94.        31243  Messages sent
  95.          208  Connects received
  96.          208  Connects sent
  97.            3  Response timeouts
  98.            0  Received connect resource errors
  99.           11  Maximum logical links active
  100.            0  Aged packet loss
  101.            0  Node unreachable packet loss
  102.            0  Node out-of-range packet loss
  103.            0  Oversized packet loss
  104.            0  Packet format error
  105.            0  Partial routing update loss
  106.            0  Verification reject
  107.  
  108.  
  109. **************************************************
  110. In response to my query I have received the following:
  111.  
  112. From: "FLOWERS HARRY" <FLOWERS@memstvx1.memst.edu>
  113. Subject: Re: Lost LAT sessions
  114. To: "psmode" <psmode@jeslacs.wimsey.bc.ca>
  115.  
  116. We've had the same problems.  Typically with SMG-based applications,
  117. but also happens with LISP.  I've got a command procedure that hunts
  118. them down and kills them.  I'll include it at the end.
  119.  
  120. >So far, DEC has sent the latest patch kits and had us install them, but
  121. >to no avail.
  122.  
  123. Yea, we went around with DEC on this, but they've decided it's a feature.
  124. Evidently, if you try to do I/O to a LAT port after it's disconnected, this
  125. happens.  They suggested checking all return statuses carefully, and avoiding
  126. any I/O to a port once you get a disconnect error.  Evidently, SMG isn't
  127. handling this correctly.  They've got a fix for VAX LISP to keep it from
  128. happening there.  If you ever get them to admit that there's actually a
  129. problem with either SMG or LAT software in this regard, please let me know.
  130.  
  131. --
  132. Harry Flowers                           Internet: FLOWERS@MEMSTVX1.MEMST.EDU
  133. Memphis State University                & Bitnet: FLOWERS@MEMSTVX1
  134.  
  135. **************************
  136. From: grant%mighty.dnet@gw.wmich.edu (NORM GRANT)
  137. To: psmode@jeslacs.wimsey.bc.ca
  138. Subject: LAT looping?
  139.  
  140. I don't know if this relates to your problem or not, but we had a version
  141. of WordPerfect for VMS which did this if a user hung up the phone while
  142. in it.  It was a MAJOR nuisance.  Apparently the program attempted to
  143. trap the hang up or forced exit condition and went crazy when the terminal
  144. was gone.  You could have a similar problem, possibly with different
  145. software.
  146.  
  147. -------------
  148. Norman D. Grant                 INTERNET:  grant@gw.wmich.edu
  149. Western Michigan University     Voice:     (616) 387-5430
  150. University Computing Services
  151. Kalamazoo, MI  49008
  152.  
  153. **************************
  154. From:    SYSMGR@bigvax.alfred.edu (Jim Walker)
  155. Message-Id: <930126125507.30a0373a@bigvax.alfred.edu>
  156. Subject: LAT sessions getting lost
  157. To: @jeslacs.wimsey.bc.ca, psmode@jeslacs.wimsey.bc.ca
  158. X-Vmsmail-To: SMTP%"psmode@jeslacs.wimsey.bc.ca"
  159.  
  160. I have encountered that problem.  What happens to me is a user logs out of
  161. the terminal server and VMS doesn't just delete the process any more.  It
  162. aborts all $QIOs to the terminal with SS$_HANGUP or something like that.
  163. Applications are supposed to detect the fatal error and exit, but some just
  164. keep retrying and sucking up CPU time.  SHOW DEVICE LTAxxx: reports that
  165. the device is offline.  Now I run a detached process that wakes up once a
  166. minute and does $DEVICE_SCAN and $GETJPI looking for offline LTAxxx:s and
  167. deletes processes.  The fortran program follows my .SIG.  It's overly
  168. complicated because at the time I wrote it I thought it was going to
  169. evolve into a general idle process killer.
  170.  
  171. Jim Walker
  172. VAX System & Network manager, Alfred University Computer Center,
  173. Alfred, NY 14802 USA        +1-607-871-2222,    Using VAX/VMS 5.4-3
  174. <SYSMGR@bigvax.alfred.edu>, SYSMGR@CERAMICS.bitnet, WALKER@ALFREDU.bitnet
  175.  
  176. **************************************************
  177.  
  178.  
  179. Any insight from WPCorp would be appreciated. Also, If somebody could 
  180. check the fiche to see if there is any common element to the $QIOs that 
  181. are triggered by calling input routines from SMG, VAX BASIC and LISP.
  182.  
  183.  
  184. -- Peter
  185. **************************************************************************
  186. *   Peter Smode                 E-mail:    psmode@jeslacs.wimsey.bc.ca   *
  187. *   JES Library Automation      Voice:     (604)939-6775                 *
  188. *   Coquitlam, BC, CANADA       Fax:       (604)939-9970                 *
  189. **************************************************************************
  190.