home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / rec / arts / intfict / 1127 < prev    next >
Encoding:
Text File  |  1992-12-22  |  3.3 KB  |  71 lines

  1. Newsgroups: rec.arts.int-fiction
  2. Path: sparky!uunet!paladin.american.edu!darwin.sura.net!udel!rochester!cantaloupe.srv.cs.cmu.edu!crabapple.srv.cs.cmu.edu!mkant
  3. From: mkant+@cs.cmu.edu (Mark Kantrowitz)
  4. Subject: Re: Text Generation Similar to Code Generation
  5. Message-ID: <BzMwFJ.JtD.1@cs.cmu.edu>
  6. Sender: news@cs.cmu.edu (Usenet News System)
  7. Nntp-Posting-Host: glinda.oz.cs.cmu.edu
  8. Organization: School of Computer Science, Carnegie Mellon
  9. References: <9754280@MVB.SAIC.COM>
  10. Date: Tue, 22 Dec 1992 00:09:18 GMT
  11. Lines: 58
  12.  
  13. In article <9754280@MVB.SAIC.COM> Whitten@Fwva.Saic.Com (David Whitten) writes:
  14. >As I understand it, a compiler may generate inefficient or ugly code,
  15. >but then a second program looks at what it generated and applies some
  16. >pattern matching to it.  When the output matches specific patterns,
  17. >then the machine code is replaced with shorter/faster/better code that
  18. >does the same thing.  This program is called the peephole optimizer
  19. >because it only looks at the code "through a peep hole" and doesn't
  20. >really know much about the way it was created, just how it looks on
  21. >output.
  22.  
  23. You're coalescing two different concepts. Peephole optimization is a
  24. form of bounded lookahead. Many NLG systems that are concerned with
  25. text realization can be considered LL(k) transducers. Lookahead is
  26. different from rewriting or revising generated text. See for example,
  27. Marie Meteer (Vaughan) and David McDonald, "A Model of Revision in
  28. Natural Language Generation", ACL-86, pages 90-96, or Marie's more
  29. recent paper in Cecile Paris's book. Another paper on this topic is
  30. Richard Gabriel's "Deliberate Writing" in McDonald's 1988 book. In it
  31. he describes the Yh system, which uses critics and repeated editing to
  32. improve the generated text.
  33.  
  34. >I'm sure the work being done by the OZ researchers has considered, or is
  35. >considering something similar to this.  
  36.  
  37. Yes, this is one of the ideas involved in the GLINDA natural language
  38. generation system. See my INLGWS92 paper in the list Peter posted for
  39. details. 
  40.  
  41. > The problem comes from recognizing 'writing style' enough to make a
  42. > collection of patterns that generates writing with a consistent style.
  43.  
  44. True, that's one of the reasons why style is a difficult topic. Just
  45. coming up with a good definition of "style" is hard.
  46.  
  47. >Of course, anything more than a simple syntactic level style is a big
  48. >problem. 
  49. >You see mate, I kin tawk funnee an' youz kin get a fee-eel fur mein 
  50. >siinktaktik stiile but th's ain't no how thee same as me wrrrritin' style.
  51. >I think we would be pushing the current state of IF simply to have 
  52. >artificial personalities in an adventure which just had differing 
  53. >syntactic styles.
  54.  
  55. I disagree. Syntactic style and lexical style are equally difficult.
  56. GLINDA uses the same mechanisms to handle both. 
  57.  
  58. It isn't clear to me what you mean by "syntactic style".  The example
  59. you give is one of dialectal variation. Dialectal variation involves
  60. many factors: particular syntactic organization (e.g., your example
  61. starts with a vocative and combines several clauses with
  62. conjunctions), lexical selection (e.g., use of "mate", "ain't", "no
  63. how"), pronunciation (e.g., "tawk" instead of "talk", "writin'",
  64. "thee") and so on. Limiting the generator to just the syntactic level
  65. of organization would yield stilted sounding text.
  66.  
  67. --mark
  68. Oz Interactive Fiction Project
  69.  
  70.