home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 977 < prev    next >
Encoding:
Internet Message Format  |  1993-01-01  |  2.3 KB

  1. Path: sparky!uunet!mcsun!sun4nl!cwi.nl!dik
  2. From: dik@cwi.nl (Dik T. Winter)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <8496@charon.cwi.nl>
  7. Date: 1 Jan 93 22:27:01 GMT
  8. References: <1i0vnmINN352@rodan.UU.NET> <8494@charon.cwi.nl> <1i2durINN2pj@rodan.UU.NET>
  9. Sender: news@cwi.nl
  10. Organization: CWI, Amsterdam
  11. Lines: 51
  12.  
  13. In article <1i2durINN2pj@rodan.UU.NET> avg@rodan.UU.NET (Vadim Antonov) writes:
  14.  > >If so, what are the consequences,
  15.  > 
  16.  > The good spell-checker will suggest to replace the letter with the
  17.  > correct one.
  18.  
  19. I can imagine the confusion:
  20.   spelling error, suggested replacement "a for "a.
  21.  > 
  22.  > >Moreover, one question: how would you encode the German A-umlaut such that
  23.  > >it sorts properly (i.e. as if it is the letter combination AE)?
  24.  > 
  25.  > The sorting order should be strict -- if you have two identical words
  26.  > with a-umlaut and ae in the middle is it the same word? If it is then
  27.  > ae IS a variation of a-umlaut and should always be treated as a signle
  28.  > letter.
  29.  > 
  30. I do not think you understand.  From the AVON (Amtliches Verzeichnis der
  31. Ortnetzkennzahlen) edition 1985, which gives area codes for the places in
  32. Germany.  The next is a selection of places mentioned ("o is o-umlaut):
  33.     Modautal
  34.     M"ockm"uhl
  35.     ...
  36.     M"ornsheim
  37.     Moers
  38.     M"ossingen
  39.     ...
  40.     M"otzingen
  41.     Mogendorf
  42. now come up with a coding that allows this (standard German) sorting.
  43. Note that it is not allowed to spell Moers as M"ors, that is a severe
  44. spelling error!  On the other hand in the absense of umlauts it is
  45. allowable to spell "o as oe (because it is in fact a shorthand for it),
  46. but to do so when there are umlauts available does not look very good.
  47.  > 
  48.  > >Even in
  49.  > >a single language (German) you can not come up with a coding that gives
  50.  > >proper sorting. 
  51.  > 
  52.  > You can come with a reasonable approximation anyway.
  53.  
  54. If so, what do you deem reasonable in this case?
  55. ...
  56.  > Forget about "traditions" -- users do not care which code is inside if
  57.  > it looks like their usual stuff.
  58.  
  59. So users are completely uninterested in the coding and the sorting algorithm
  60. used!
  61. -- 
  62. dik t. winter, cwi, kruislaan 413, 1098 sj  amsterdam, nederland
  63. home: bovenover 215, 1025 jn  amsterdam, nederland; e-mail: dik@cwi.nl
  64.