home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1267 < prev    next >
Encoding:
Internet Message Format  |  1993-01-21  |  2.4 KB

  1. Path: sparky!uunet!cs.utexas.edu!sun-barr!sh.wide!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  2. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <2770@titccy.cc.titech.ac.jp>
  7. Date: 21 Jan 93 17:20:13 GMT
  8. References: <1993Jan9.031217.27425@fcom.cc.utah.edu> <1in56mINNnhq@life.ai.mit.edu> <2676@titccy.cc.titech.ac.jp> <1ippgmINN7af@life.ai.mit.edu>
  9. Sender: news@titccy.cc.titech.ac.jp
  10. Organization: Tokyo Institute of Technology
  11. Lines: 55
  12.  
  13. In article <1ippgmINN7af@life.ai.mit.edu>
  14.     glenn@wheat-chex.ai.mit.edu (Glenn A. Adams) writes:
  15.  
  16. >>Different Characters with different stroke counts are mapped to a
  17. >>single code point in 10646/Unicode.
  18. >
  19. >For those in the listening audience who don't read Hanzi or Kanji, I should
  20. >say that Ohta-san is correct, but in a completely frivolous way.  Stroke
  21. >counts are a bit subjective.  Some people count some elements as distinct
  22. >strokes, whereas others do not.
  23.  
  24. Wrong. That's not what I'm referring.
  25.  
  26. >However, there is no systematic difference
  27. >in the way that Japanese count strokes versus the way that Chinese count
  28. >strokes versus the way that Koreans count strokes.  The ways that CJK
  29. >standards bodies count strokes are extremely uniform;
  30.  
  31. True, but it is misleading.
  32.  
  33. Consider, for example, a very common radical used for plant-related
  34. characters, such as grass and flowers (character code from 827C to 864F
  35. of DIS 10646-1.2).
  36.  
  37. Its shape in Japanese or mainland China is
  38.  
  39.         *        *
  40.      ****************
  41.         *        *
  42.  
  43. whose stroke count is 3, while its shape in Taiwan and Korea is
  44.  
  45.         *        *
  46.      *******  *******
  47.         *        *
  48.  
  49. whose stroke count is 4. But, these different characters with differently
  50. shaped radicals are unified in Unicode.
  51.  
  52. >therefore, the
  53. >unification of CJK characters into single Han code elements does not 
  54. >remove discriminating information;
  55.  
  56. Therefore, the stroke count information, which is "THE EXTREMELY UNIFORM"
  57. property of characters, are destroyed by Han unificaiton.
  58.  
  59. This is the reality.
  60.  
  61. >This is a bit like saying "Japanese (or English or another language) is
  62. >context dependent.  Don't use it."  Come on Ohta-san, return to reality.
  63. >Try making a rational argument.
  64.  
  65. I have come again. I'll be happy if you stop dreaming and shut up.
  66.  
  67.                         Masataka Ohta
  68.