home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 989 < prev    next >
Encoding:
Internet Message Format  |  1993-01-02  |  2.4 KB

  1. Path: sparky!uunet!spool.mu.edu!yale.edu!yale!mintaka.lcs.mit.edu!ai-lab!wheat-chex!glenn
  2. From: glenn@wheat-chex.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Date: 2 Jan 1993 05:57:17 GMT
  6. Organization: MIT Artificial Intelligence Laboratory
  7. Lines: 37
  8. Message-ID: <1i3artINN5jo@life.ai.mit.edu>
  9. References: <1hvu79INN4qf@rodan.UU.NET> <1i0oj2INNp4v@life.ai.mit.edu> <1i13rrINNars@rodan.UU.NET>
  10. NNTP-Posting-Host: wheat-chex.ai.mit.edu
  11. Keywords: ISO10646 Unicode
  12.  
  13. In article <1i13rrINNars@rodan.UU.NET> avg@rodan.UU.NET (Vadim Antonov) writes:
  14.  
  15. >Somehow i had introduced my "own" cyrillic encoding and it lived (and
  16. >still lives) and was used by a lot of people (it became obsolete nearly
  17. >at the time it was approved as a national standard). The company i worked
  18. >before managed to create a totally bilingual family of Unix-like systems --
  19. >something unheard of in the West.
  20.  
  21. You're uninformed.  Try looking at Xerox Viewpoint (West European,
  22. East European, Greek, Arabic, Hebrew, Chinese, Japanese, Korean, et al);
  23. try looking at BB&N Slate (West & East European, Greek, Hebrew, Arabic,
  24. Korean, Thai).  There are others: Nota Bene, Multilingual Scholar,
  25. AlKatiib, etc.
  26.  
  27. Tell me how to sort Tibetan, Burmese, Khmer, and Japanese, providing
  28. all established culturally expected orderings.  After you've done
  29. this, let me know whether you think a character set can handle the
  30. burden of correct sorting.  Its not that this isn't an admirable goal;
  31. its just that it is untenable given the overall design goals
  32. of Unicode -- or any other character set that could stand a chance of
  33. becoming a universal character set standard, and not being horribly
  34. inefficient.
  35.  
  36. You might want to read a paper entitled "Collating Unicode Data"
  37. by Alain LaBonte, Ministry of Communications, Quebec, before
  38. arguing further.  It is contained in the proceedings of the Unicode
  39. Implementors Workshop.  It will verily destroy all the arguments
  40. you've offered so far.
  41.  
  42. If you are interested in a paper discussing the architecture of a
  43. multilingual toolkit in which sorting *is* handled, and which *does*
  44. support Unicode, and which *does* facilitate language tagging, then
  45. see the file /pub/mlt2-overview.ps.Z (a compressed postscript file) on
  46. METIS.COM [140.186.33.40] by anonymous FTP.  [If you have no FTP access,
  47. let me know and I can uuencode and email it.]
  48.  
  49. Glenn Adams
  50.