home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / bit / listserv / csgl / 1941 < prev    next >
Encoding:
Text File  |  1992-12-22  |  6.6 KB  |  130 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!zaphod.mps.ohio-state.edu!howland.reston.ans.net!paladin.american.edu!auvm!BEN.DCIEM.DND.CA!MMT
  3. Message-ID: <9212220132.AA06039@chroma.dciem.dnd.ca>
  4. Newsgroups: bit.listserv.csg-l
  5. Date:         Mon, 21 Dec 1992 20:32:52 EST
  6. Sender:       "Control Systems Group Network (CSGnet)" <CSG-L@UIUCVMD.BITNET>
  7. From:         mmt@BEN.DCIEM.DND.CA
  8. Subject: Re: Info theory
  9. Lines: 119
  10.  
  11. [Martin Taylor 921221 20:00]
  12. (Bill Powers 921221.1500)
  13.  
  14. Bill, your posting just arrived, as I was on the way out to go home, so this
  15. must be short (our phone lines have got very bad recently, and I can no
  16. longer try to do it from home).
  17.  
  18. As usual, you are an acute observe, especially in relation to the question
  19. of model types.  But I really do think that I can use information theory
  20. to identify that the PCT structure was correct, at least feasible.  When
  21. you put in the appropriate perceptual input functions, gains, and delays,
  22. you get the same model that you and/or Tom would produce without information
  23. theory, so it should make the same predictions in any specific case.  So
  24. why should I try to do better, when I anticipate the result being identity?
  25.  
  26. What I do want to do is to get some deductions about the structure and its
  27. behaviour that are not obvious, even though they may (should) agree with
  28. what you have found to work in practice.  I find that it makes much more
  29. sense to me to have a good theoretical underpinning that allows me to
  30. generalize from a practical result than just to see the practical result
  31. and wonder what might happen if some little thing were changed.
  32.  
  33. >Martin, the difference that Tom is talking about, I believe, is
  34. >between a descriptive model and a generative model. A descriptive
  35. >model provides a general picture of which a specific behavior is
  36. >only one example. A generative model actually generates
  37. >(simulated) behavior for direct point-by-point comparison with
  38. >real behavior.
  39.  
  40. Yes, I understand.  I have a bit of a problem with limiting myself to
  41. either kind of model exclusively, though, and it is a problem that has
  42. been with me since undergraduate days.  If a generative model does
  43. predict reality well, without excessive use of parameters, then it
  44. produces strong evidence of the plausibility of the theory that
  45. underlies it.  But if the generative model fails, it does not give
  46. evidence against the underlying theory, because the failure could
  47. have been only in the choice of parameters.  So the generative model
  48. is a one-sided kind of support.
  49.  
  50. On the other hand, the theory by itself is only plausible unless it
  51. can be shown to predict reality, and that can be done only through
  52. generative models or mathematical analysis.  In the case of your and
  53. Tom's models, the prediction is very good.  So I see little point in
  54. trying to create generative models from what I see as a theoretical
  55. support for the same structure on which your models are based.  It
  56. is conceivable that in some situations the information-theoretic
  57. approach might produce numerical statements of more precision or using
  58. fewer parameters, but those situations probably will not be easy to
  59. find.  They will be at higher levels in the hierarchy, most probably.
  60. I'm not even going to look for them at present, at least not until
  61. I can see some problems with your practical approach that are resolved
  62. in the information-theoretic approach.
  63.  
  64. >In the end, the generative model will explain behavior, while
  65. >descriptive models show that the behavior thus explained and the
  66. >structure of the successful model are consistent with general
  67. >laws.
  68.  
  69. Wise.
  70.  
  71. I obviously must either drop the information-theory thread or take it
  72. much further back to first principles.  In response to what Tom seemed
  73. to want in his revised version of his challenge, I anticipated doing
  74. just that.  But perhaps it would help if I contradicted one of your
  75. assumptions:
  76.  
  77. >You seem to be taking the position of an external observer who
  78. >has one probe on the reference signal and another on the
  79. >perceptual signal.
  80.  
  81. No.  Throughout, I am trying to take the position that the only
  82. probabilities that can be observed are based within the observing entity.
  83. Sometimes I slip, I acknowledge.  But that's a simple mistake, not
  84. a failure of principle.  In this case, the reference signal and
  85. the perceptual signal are both known within the ECS.  If you remember
  86. a long way back, this came up.  There is no need for an external
  87. evaluation of the probability distribution, any more than there is a
  88. need for an evaluation of a neural current that is based on a rate
  89. of neural impulses.  I suppose it might be possible for an external
  90. observer with a probe to make the analyses, and sometimes it is
  91. didactically easier to posit such an observer.  But in practice there
  92. isn't one, and it is not necessary to think of one.
  93.  
  94. One didactic problem is that WE are external to the ECS in question, so
  95. that WE externally observe (imagine) what is going on.  But we have to
  96. try to imagine ourselves being in the ECS.  It's not easy.
  97.  
  98. As you can see, we do not
  99. >begin with the
  100. >phenomenon of messages passing between behaving systems.
  101.  
  102. I've been playing with information at an intuitive level for as long as
  103. you've been playing with control systems.  It's hard for me to get back
  104. to basics (or even to exact formulae, since I don't use them much), but
  105. it will be a good exercise for me to try.
  106.  
  107. >If the reference signal and the perceptual signal are both
  108. >varying in a pattern that requires a bandwidth of, say, 2 Hz,
  109. >doesn't this mean that both signals are carrying information at a
  110. >rate corresponding to that bandwidth?
  111.  
  112. They could be, but they need not be.  The problem is in thinking of
  113. information as being carried, as if an external observer could see it.
  114. That's the same problem as the "codingism" problem.  The information
  115. arriving at a receiving point depends on the probabilities of the
  116. received pattern as believed by the receiver, which are unknown to
  117. any other party.  The information the originator thinks is being sent
  118. is based on the originator's beliefs as to the probabilities held by
  119. the receiver.  In the 2Hz case, the presumption is that all these
  120. probabilities are flat (actually Gaussian) distributions, maximizing
  121. the information that could be transmitted.
  122.  
  123. Anyway, I'll try to put together a discussion of this, but it may take
  124. some time.  I'm sorry I annoyed Rick with my comment.  Information
  125. theory clearly isn't as easy to understand as I thought, but in any
  126. case I had no right to say soemthing that could be perceived as insulting.
  127. I'm afraid I may have done it again, in a somewhat hasty reaction to
  128. Rick's riposte.  Rick--if you are reading this--let's try to keep things
  129. more technical, if we can.
  130.