home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 963 < prev    next >
Encoding:
Internet Message Format  |  1993-01-01  |  1.6 KB

  1. Path: sparky!uunet!not-for-mail
  2. From: avg@rodan.UU.NET (Vadim Antonov)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Date: 1 Jan 1993 02:31:17 -0500
  6. Organization: UUNET Technologies Inc, Falls Church, VA
  7. Lines: 29
  8. Message-ID: <1i0s05INNnfn@rodan.UU.NET>
  9. References: <8490@charon.cwi.nl> <1992Dec31.171450.1513@klaava.Helsinki.FI> <1992Dec31.203101.5447@prl.dec.com>
  10. NNTP-Posting-Host: rodan.uu.net
  11. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  12.  
  13. In article <1992Dec31.203101.5447@prl.dec.com> boyd@prl.dec.com (Boyd Roberts) writes:
  14. >There are two problems:
  15. >    1. Getting an encoding of the characters.
  16. >    2. Getting local conventions right.
  17. >Problem 2 is hard.  Problem 1 should not address problem 2.
  18.  
  19. Oops. Nice try. Come again.
  20.  
  21. The ONLY reason people invent charcter encoding standards is to
  22. "get local conventions right". If you've got your own machine which
  23. does not communicate with others you can choose your own arbitrary
  24. encoding.
  25.  
  26. A good encoding should support easy (i'd say natural) localization.
  27. It should provide simple algorithms for simple functions
  28. like getting string length, searching a character, case-insensitive
  29. comparison, lexicographical comparison.
  30.  
  31. Unicode (and for that matter Plan 9 UTF) does not support the last
  32. two mentioned functions. I have yet to see Plan 9 _sort_ which will
  33. sort Russian strings without being told explicitly that it is Russian.
  34.  
  35. >Plan 9 utf solves Problem 1.
  36.  
  37. UTF does not solve the problem 1 -- it is merely a way to encode
  38. 16-bit unsigned integers in the way which (supposedly) will not
  39. aggravate the ASCII world.
  40.  
  41. --vadim
  42.