home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1256 < prev    next >
Encoding:
Internet Message Format  |  1993-01-21  |  2.4 KB

  1. Path: sparky!uunet!paladin.american.edu!howland.reston.ans.net!spool.mu.edu!yale.edu!yale!mintaka.lcs.mit.edu!ai-lab!muesli!glenn
  2. From: glenn@muesli.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Radicals Instead of Characters
  5. Date: 21 Jan 1993 08:39:57 GMT
  6. Organization: MIT Artificial Intelligence Laboratory
  7. Lines: 40
  8. Message-ID: <1jlngtINNqnk@life.ai.mit.edu>
  9. References: <1jhvstINNbcq@flop.ENGR.ORST.EDU> <1993Jan20.233154.19733@fcom.cc.utah.edu> <MELBY.93Jan21144739@dove.yk.fujitsu.co.jp>
  10. NNTP-Posting-Host: muesli.ai.mit.edu
  11.  
  12. In article <MELBY.93Jan21144739@dove.yk.fujitsu.co.jp> melby@dove.yk.fujitsu.co.jp (John B. Melby) writes:
  13. >Looking at Han characters in a probabilistic sense probably is not going
  14. >to help much, since the positioning of radicals varies widely between
  15. >characters.
  16.  
  17. The idea being discussed for Han decomposition would have different
  18. combining radicals for each of the possible positions the radical
  19. could take; e.g. MAN-LEFT, MAN-TOP, MAN-BOTTOM, etc.
  20.  
  21. >(1) some rare characters cannot be expressed in this manner,
  22.  
  23. Characters which could not be decomposed in this manner would be
  24. represented in their entirety (i.e., as non-decomposed symbols).
  25.  
  26. >(2) allowing the display of arbitrary characters using this sort of
  27. >composition does not mean that their components will be aesthetically
  28. >spaced.
  29.  
  30. A system that displayed such decomposed symbols would most likely
  31. employ a font which either (1) contained glyphs that represented the
  32. entire symbol; or (2) contained internal instructions that would allow
  33. it to position the radical properly.  In both cases, the correct
  34. display geometry would be used.  The display engine would have to
  35. map multiple coded character elements to single glyph references
  36. or mutliple glyph references as appropriate.
  37.  
  38. >A 16 bit font is insufficient for encoding rare characters, whichever way
  39. >you look at it, although having 16-bit CJK unification and a user-defined
  40. >character facility may be sufficient for an average user.
  41.  
  42. Keep in mind that there is no necessary relation between a 16-bit character
  43. encoding and a 16-bit font.  One can have a 16-bit character encoding like
  44. Unicode (with 20,902 precomposed Han characters, and possibly a collection
  45. of combining radical characters) and display with a 16-bit font that contains
  46. 2^16 Han glyphs, or even with a 24-bit font, a 32-bit font, etc.  The
  47. relation of Unicode character code to font code is not defined by the
  48. Unicode display model.
  49.  
  50. Glenn Adams
  51.  
  52.