home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 971 < prev    next >
Encoding:
Internet Message Format  |  1993-01-01  |  2.9 KB

  1. Path: sparky!uunet!haven.umd.edu!ames!agate!usenet.ins.cwru.edu!gatech!enterpoop.mit.edu!eru.mt.luth.se!kth.se!sunic!news.funet.fi!funic!nntp.hut.fi!nntp.hut.fi!kiravuo
  2. From: kiravuo@hut.fi (Timo Kiravuo)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <KIRAVUO.93Jan1164705@lesti.hut.fi>
  6. Date: 1 Jan 93 15:47:05 GMT
  7. References: <1992Dec30.061759.8690@fcom.cc.utah.edu> <1hu9v5INNbp1@rodan.UU.NET>
  8.     <8490@charon.cwi.nl> <1992Dec31.171450.1513@klaava.Helsinki.FI>
  9. Sender: usenet@nntp.hut.fi (Usenet pseudouser id)
  10. Reply-To: kiravuo@hila.hut.fi
  11. Organization: Helsinki University of Technology, Computing Center
  12. Lines: 43
  13. In-Reply-To: wirzeniu@klaava.Helsinki.FI's message of Thu, 31 Dec 1992 17:14:50 GMT
  14. Nntp-Posting-Host: lesti.hut.fi
  15.  
  16. In article <1992Dec31.171450.1513@klaava.Helsinki.FI> wirzeniu@klaava.Helsinki.FI (Lars Wirzenius) writes:
  17. >A-with-ring-on-top -- don't know its official name, if any.  The
  18. >Finnish alphabet has no A-w-r-o-t, so I guess they have A-umlaut after
  19. >Z, although they/we seem to usually include the A-w-r-o-t too, thereby
  20.  
  21. No, the Finnish alphabet is the same as the Swedish one. Letters
  22. A to Z, A with ring, A with two dots, O with two dots. The
  23. sorting is also done in this order, except V and W are usually
  24. sorted (should be sorted) as one letter. If we use the currently
  25. common 7-bit coding, characters ], [ and \ are replaced with A',
  26. A" and O" (and }, { and | with a', a" and o", meaning that
  27. sorting will not work with direct code sorting. Neither will it
  28. in any different currently used coding (ISO 8859-1, DEC
  29. Multinational, HP Roman-8, EBCDIC (the Scandinavian version we
  30. are using), IBM PC or the Macintosh).
  31.  
  32. Also the telephone catalog seems to sort "Mc", "Mac", "van" and
  33. "le" as they are written, but "von", "Von" and "der" according to
  34. the main word.
  35.  
  36. Now if we also take into the account that French e' will usually
  37. become E when capitalized and other well known charater behaviors
  38. like the German double-s, it is my opinion that there is no way
  39. to make a simple character code that will preform sorting and
  40. character conversion automatically. 
  41.  
  42. So the ISO 10646 approach seems right to me. Make a character
  43. code that codes just the appearance of the characters and leave
  44. the rest for other people to worry about. My understanding is
  45. that the making of ISO 10646 has been politically difficult
  46. enough as it is, tryig to add more stuff into the standard would
  47. just have blown the whole thing apart.
  48.  
  49. About the differences between Swedish and German (and Finnish)
  50. A", I don't know why we should consider them as separate letters,
  51. they are pronounced about the same way in all languages.  And
  52. most of the other letters usually differ in other languages as
  53. well. The Swedish letter O is pronounced like the Finnish U, in
  54. English Y is as often concidered a vowel as not, while in Finnish
  55. it is always a vowel etc.
  56. --
  57. Timo Kiravuo, kiravuo@hut.fi
  58. Helsinki University of Technology, Computer Center, Finland
  59.