home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 976 < prev    next >
Encoding:
Internet Message Format  |  1993-01-01  |  1.8 KB

  1. Path: sparky!uunet!not-for-mail
  2. From: avg@rodan.UU.NET (Vadim Antonov)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Date: 1 Jan 1993 17:39:40 -0500
  6. Organization: UUNET Technologies Inc, Falls Church, VA
  7. Lines: 30
  8. Message-ID: <1i2h7cINN3qj@rodan.UU.NET>
  9. References: <1992Dec31.203101.5447@prl.dec.com> <1i0s05INNnfn@rodan.UU.NET> <TT.93Jan1135637@tarzan.jyu.fi>
  10. NNTP-Posting-Host: rodan.uu.net
  11.  
  12. In article <TT.93Jan1135637@tarzan.jyu.fi> tt@tarzan.jyu.fi (Tapani Tarvainen) writes:
  13. >>Unicode (and for that matter Plan 9 UTF) does not support the last
  14. >>two mentioned functions. I have yet to see Plan 9 _sort_ which will
  15. >>sort Russian strings without being told explicitly that it is Russian.
  16. >
  17. >So what?
  18. >I've yet to see anything even planned that would allow sorting
  19. >both Finnish and German without being told which is wanted.  
  20. >In fact I can't even imagine one that would make any sense.
  21. >In the case of a list of names, the very same data could be
  22. >sorted differently depending on where it is going to be used.
  23.  
  24. Pfrr, take a look at DEMOS Unix-likes -- they do sort both Russian and English
  25. without being told which is wanted. [<ah>-<ya>]* in shell really selects
  26.                       ^    ^ -- imagine real cyrillic letters here
  27. all files startting from lowercase russian letter. lex generates correct
  28. parsers for languages with russian keywords. Grep works as it is supposed to.
  29. So far no user complained that there are two o's and two A's in the code.
  30.  
  31. It is not impossible -- it's rather easy if the right code is choosen.
  32.  
  33. >Tying sorting rules to character sets is not a good idea, IMHO.
  34.  
  35. Would you like to specify the language for every range in every regular
  36. expression you use?
  37.  
  38. Embedding sorting rules to character sets is not a "good idea" -- it's
  39. a necessity and you can do nothing about it.
  40.  
  41. --vadim
  42.