home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / sys / isis / 350 < prev    next >
Encoding:
Internet Message Format  |  1992-12-27  |  9.6 KB

  1. Path: sparky!uunet!gossip.pyramid.com!olivea!spool.mu.edu!yale.edu!ira.uka.de!math.fu-berlin.de!unidui!Germany.EU.net!mcsun!inesc.inesc.pt!freya.inesc.pt!werner
  2. From: werner@freya.inesc.pt (Werner Vogels)
  3. Newsgroups: comp.sys.isis
  4. Subject: Re: Forwarded comments Re: Notes on IP Multicast option for ISIS
  5. Message-ID: <1992Dec27.131152.26418@inesc.pt>
  6. Date: 27 Dec 92 13:11:52 GMT
  7. References: <1992Dec24.162642.27415@cs.cornell.edu> <1992Dec24.165539.28302@cs.cornell.edu>
  8. Sender: usenet@inesc.pt (USENET News System)
  9. Organization: INESC - Instituto de Engenharia de Sistemas e Computadores, Lisboa, Portugal
  10. Lines: 172
  11. Nntp-Posting-Host: freya.inesc.pt
  12.  
  13.  
  14. |> This is very interesting.  If altrnatives to mrouted surface, I hope people
  15. |> will keep us informed!  As it happens, Isis depends only very slightly on
  16. |> routing and certainly doesn't count on the membership information in any
  17. |> significant way (except that you obviously won't get a speedup until the
  18. |> add-member information propagates enough so that packets are forwarded, if
  19. |> necessary, to a new member!)
  20.  
  21. There is a performance cost (more retries) if you start sending immediately
  22. after you have joined, and the other members are further away. The same for 
  23. the build up of the tables after a crash, eventually the tables will be 
  24. correct but it may cause stations on a connected link to consider the other 
  25. stations down, or partitioned. The failure detection modules should cover 
  26. this correctly but it triggers some overhead.
  27.  
  28. It would be nicer to be able to rely on your router to have correct 
  29. information about other connected links, you wouldn't have to go over to 
  30. the link to make sure you router's information isn't out of date. It has 
  31. to do with the fact that you keep membership information at two levels:
  32. ISIS and mcastip, where the latter is of no use to the first.  
  33.  
  34. |> As for the TTL, I currently use TTL_SITE, but you could reconfigure the
  35. |> code to change this.  Should it be an option?
  36.  
  37. If you are not connected to the mbone, the ttl is only important if you
  38. have setup routing between subnets in your organization. The metrics on 
  39. the links define how far you message will travel within your organization. 
  40. Of course this also depends on your network topology. 
  41.  
  42. |>  Should it be an option?
  43.  
  44. If you only use mcastip as a generic mechanism and can be sure that there
  45. will be no conflicts with other users of mcastip you shouldn't worry about 
  46. the scope. But if more users (other software packages) use mcastip you 
  47. should be careful with choosing your ttl so you can limit the resources 
  48. used. 
  49.  
  50.  
  51. |> >With port do you mean UDP port or mcastip ip address? 
  52. |> 
  53. |> Both.  The way that Steve Deering's code works, an ipmcast address is
  54. |> associated with one or more ports, which have normal UDP port numbers.
  55. |> The port number on the incoming mcast packet is used to decide who  gets
  56. |> a copy among those who added themselves to the IP multicast group.
  57. |> So, for an Isis group, you would ideally want to have a port per group
  58. |> as well as an IP multicast address per group.  If you have less, say one
  59. |> port for everyone, there is no choice but to re-use port numbers (hence
  60. |> we use SO_REUSADDR) and this means that processes will get ipmcasts sent to
  61. |> groups other than the one they belong in some cases -- specifically, when
  62. |> two groups with the same port number are used on the same machine...
  63.  
  64. So you would only re-use ports every n-thousand, but ipmcast address much
  65. more often. When having a large port range you can have the OS levels
  66. filter for you if you reuse ipmcast addresses.
  67.  
  68. |> 
  69. |> Anyhow, this is all hidden from users.  It has performance implications
  70. |> but normally they won't be major ones...  The number of ports available
  71. |> is a compile time system parameter for Isis itself.
  72.  
  73. But we simple fools with only an Academic License will get a predefined
  74. number, would  there be a way to make this dynamically configurable?
  75.  
  76. |> >Personally I think you should have a second selection mechanism so you can
  77. |> >still use mcastip (and hw multicast) to be used in other then diffusion mode.
  78. |> 
  79. |> I think you may not be aware of what diffusion mode means in Isis, since
  80. |> this remark confuses me.  
  81.  
  82. indeed, I should have read the manual instead of relying on my intuition.
  83.  
  84. |> >We have more applications running (conferencing, etc) that use mcastip, so we
  85. |> >can never be sure that the complete address space at the controller is to be
  86. |> >allocated to the group communication module.
  87. |> 
  88. |> When in my stuff, I have one group (/sys/ipmcast) that handles the allocation
  89. |> of ipmcast addresses.  But if other applications use it, I will have a problem,
  90. |> true...
  91.  
  92. You definitely will, because more and more packages will start using 
  93. ipmcast if it come available. Especially those interested in anonymous
  94. group membership. I have already seen several servers (naming, printers,
  95. etc) that use mcastip for fault-tolerance or location transparency. The
  96. current ipmcast implementation will have to change to support a larger
  97. number of users, but this effort will have to be done by the vendors, the
  98. implementation used now was not meant to be used at this scale. But the
  99. current work on SIP and PIP is more promising, so that it would be wise
  100. not to consider ipmcast as the standard for the future, but to wait for
  101. the transition to a more capable new ip protocol.
  102.  
  103.  
  104. The use of the number of mcastip addresses is defined by the station
  105. that has the least number available. Often we use dedicated machines as
  106. server, so that the usable address space get defined by these machines.
  107. If you have several servers running at these machines, and they all use some
  108. sort of multicast based communication it becomes the bottleneck for
  109. address assignment. 
  110.  
  111. It is not only mcastip that uses hardware mcast but other protocols we
  112. run like XTP also take their share of addresses away. So that the number
  113. of addresses available can never be determined on forehand.
  114.  
  115. |> >Personally and also from experiments: if you only use mcastip on a local area
  116. |> >network you are better off making your own interface to the network and
  117. |> >multicast addresses, with more and more machines providing the BSD packet
  118. |> >filter you can reasonably standardize this as well. You will get a better
  119. |> >performance as soon as there is more then one receipient. The nit on SunOS is
  120. |> >*bad*: do not use it if you have very performance critical applications.
  121. |> 
  122. |> Perhaps I should add that as an option?  Obviously, for the near term,
  123. |> the standards argument says that Isis has to work for the vendor provided
  124. |> and supported technology.  It isn't my fault if the standard could be
  125. |> improved!
  126.  
  127. Sorry, my remarks should be seen as a general statement, for ISIS that is
  128. concerned with the use of standard protocols different rules need to be
  129. applied. Of course if new technology becomes available at this level, use
  130. it! But the current implementation of the "standard" will still need a lot
  131. of work before we can use it with a broader scope. (Personally I think
  132. we should be cautious and wait for the new IP protocols to arrive).
  133.  
  134. |> >The router we are to develop bases its interrouter communication on reliable
  135. |> >group comm methods making it easier to maintain shared state etc and restoring
  136. |> >the state will become much more efficient, etc.
  137. |> 
  138. |> Sounds like we will want to support the INESC router when you do make it
  139. |> available!  Let us know...
  140.  
  141. The routers developed at INESC are part of a project that wants to expand 
  142. our LAN oriented protocols to extended LAN's and MAN's, trying to maintain
  143. the high performance and guarantees of bounded execution time, etc. The
  144. new protocol suite that will arise from the efforts in the NAVIGATORS
  145. project will eventually incorporate these solutions for internetworking.
  146.  
  147. In principle these routers have nothing to do with mcastip. Mcastip is
  148. dedicated towards anonymous membership, and provides no guarantees, for
  149. this you need a scheme where the routers forward the message to subnets
  150. that have stations, that are possible interested in the messages transmitted
  151. at this address. This to support a possible worldwide distribution of 
  152. multicast messages.
  153.  
  154. In our interconnection work we focus on different schemes. One of the first
  155. issues is that, in the case of reliable group communication with certain
  156. order guarantees as we have been building, you can not deal with 
  157. anonymous member behavior very well. So if you build group communication
  158. for a MAN environment you will need some knowledge about where possible 
  159. members of your group can be located. We will develop our material based
  160. on the assumptions that we can limit our internetwork communication to
  161. an administrative domain with a known network topology. In this case 
  162. the limited number of routers/gateways and name/directory servers can 
  163. provide knowledge about group members that is correct and consistent. 
  164. A number of interesting opportunities arise with regard to group scope, 
  165. local use of hw-addressing and proxy or delegated execution of LAN oriented
  166. protocols.
  167.  
  168. Another issue is that I do not like the large state tables that are
  169. kept at routers. If you have a high speed, high bandwidth backbone
  170. you want to profit from this technology, you do not want to spend
  171. much time in table lookups, state restore after failure etc. The 
  172. switching at the backbone gateway stations needs to be very fast
  173. to profit from its connection to the backbone. We will provide some
  174. solutions for this.
  175.  
  176. But back to our mcastip problems, I will see if I can hack up a IGMP
  177. router to add some more reliability for the case of a single a-domain.
  178. I will let people know if I succeed. To fully profit from the high
  179. performance interconnected group communication you will have to wait 
  180. for the full release from INESC (in corporation with and compatible
  181. with .... ).
  182.  
  183. -- 
  184. Werner
  185.