home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1318 < prev    next >
Encoding:
Internet Message Format  |  1993-01-25  |  4.5 KB

  1. Path: sparky!uunet!gatech!paladin.american.edu!howland.reston.ans.net!zaphod.mps.ohio-state.edu!uwm.edu!ogicse!mintaka.lcs.mit.edu!ai-lab!wheat-chex!glenn
  2. From: glenn@wheat-chex.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <1k1c8tINN8q2@life.ai.mit.edu>
  6. Date: 25 Jan 93 18:41:33 GMT
  7. Article-I.D.: life.1k1c8tINN8q2
  8. References: <ISHIKAWA.93Jan22211810@ds5200.personal-media.co.jp> <1js0l3INN3f1@life.ai.mit.edu> <ISHIKAWA.93Jan25211508@ds5200.personal-media.co.jp>
  9. Organization: MIT Artificial Intelligence Laboratory
  10. Lines: 71
  11. NNTP-Posting-Host: wheat-chex.ai.mit.edu
  12.  
  13. In article <ISHIKAWA.93Jan25211508@ds5200.personal-media.co.jp> ishikawa@personal-media.co.jp writes:
  14. >In Japan, if a student put, say, a bar in slightly misplaced
  15. >position in a character or put the bar slightly touching other part of
  16. >the character when it should (NOTE the usage of SHOULD!) not, a student
  17. >can fail a test and required to practice until he/she gets the RIGHT
  18. >(CORRECT) writing.
  19.  
  20. Yes, I know all of this.  I learned Chinese calligraphy from a well-known
  21. calligrapher of the old school.  Stroke weight, speed, taper, angle,
  22. joins, and, yes, stroke order, were absolutely essential to produce the
  23. "correct" shape (glyph) of the character.
  24.  
  25. However, you keep missing an essential point here.  Characters != Glyphs.
  26. A character is an abstraction of shape in which *all* non-distinguishing
  27. characteristics are ignored.
  28.  
  29. A font represents a collection of glyphs, it does not represent a character
  30. set.  A font is used in the display of characters in a character set.  For
  31. example, I might choose a vertical form of a open parenthesis character if
  32. I am display Japanese in vertical mode, or I might choose a horizontal form
  33. if I am displauying in horizontal mode.  Nothing in Unicode tells me which
  34. of these to use.
  35.  
  36. >But, I can't understand where their priority was during the CJK meeting.
  37. >Wonder why they didn't voice these concerns... My guess is that they really
  38. >didn't bother to think about the mixing of different country's
  39. >character sets. Print company's delegate, for example, would never
  40. >think of using a "standard UNICODE" font at his company, of course.
  41.  
  42. You are wrong.  They very much understood the issues involved in performing
  43. unification.  First of all, they were not defining a font.  There is no
  44. such thing as a "standard UNICODE font."  A font is a collection of glyphs
  45. which has no necessary relation to a character set.
  46.  
  47. >I agree that the rich text approach is vital and INDISPENSABLE here. I
  48. >agree on this point. But in assuming the use of additional information
  49. >UNICODE certainly loses some attractiveness in the presense of
  50. >apparent lack of rich text standard that every one uses.  Your points
  51. >about the use of rich text are well taken.
  52.  
  53. If you want to display Unicode-encoded Japanese text on a simple device
  54. which does not support rich text, then all you have to do is use a font
  55. which displays the expected Japanese glyph when displaying Unicode Han
  56. characters which represent Kanji data.  That's all there is to it, nothing
  57. is complicated about this.
  58.  
  59. >But, then, I think it is best to say that rich text IS NECESSARY instead of
  60. >assuming the reading skill of modern Japanese.
  61.  
  62. No, it is not necessary.  Use a Japanese font.  Sure, if you are going to
  63. mix a text with Chinese and Japanese, then you will need to designate fonts
  64. and/or languages.  But, tell me, how many existing devices (or software) do
  65. you know of which will display a mixture of CJK and use the correct fonts
  66. without using any kind of font attributes, language attributes, or some
  67. other kind of rich text.  I do know that the MULE version of Gnu EMACS will
  68. support this, but it marks each character in a buffer according to the
  69. character set it belongs to, and it encodes CJK in separate character sets.
  70. So it does use a kind of rich text (character set attribute).  Furthermore,
  71. if you try to search for the Kanji "nihongo" in a mixed CJK MULE buffer,
  72. you aren't going to get a match on the Hanzi "ribenyu" as one might expect.
  73. By not unifying, MULE allows distinguishing between which font/language,
  74. but it prevents performing searching/sorting and other operations which
  75. might best operate on a unified character set.
  76.  
  77. CJK unification in Unicode derives the benefit of aiding many common
  78. text processing tasks, while not detracting from current display
  79. technology.  If you want a full multilingual CJK system to do typographically
  80. correct display, then you are going to need rich text no matter which
  81. character set or sets you choose to use.
  82.  
  83. Glenn Adams
  84.