home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 968 < prev    next >
Encoding:
Internet Message Format  |  1993-01-01  |  3.4 KB

  1. Path: sparky!uunet!noc.near.net!hri.com!enterpoop.mit.edu!eru.mt.luth.se!lunic!sunic!seunet!enea!sommar
  2. From: sommar@enea.se (Erland Sommarskog)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <1993Jan1.115424.27258@enea.se>
  6. Date: 1 Jan 93 11:54:24 GMT
  7. References: <1hu9v5INNbp1@rodan.UU.NET> <8490@charon.cwi.nl> <1hvu79INN4qf@rodan.UU.NET>
  8. Organization: Enea Data AB
  9. Lines: 64
  10.  
  11. Vadim Antonov (avg@rodan.UU.NET) writes:
  12. >If a combination of letters is treated as a letter IT IS A LETTER.
  13. >Then add it to the alphabet and let the keyboard driver (which surely
  14. >knows the language -- simply because there are different keyboard
  15. >layouts) to handle the matter.
  16.  
  17. So if I type a C then a million key presses later changes puts in
  18. an H after the C how can the keyboard driver handle that? It might
  19. not even be the same driver who are seeing the two!
  20.  
  21. >FYI, English has some compound letters too (though they're used only 
  22. >in typesetting) -- ff, fff, fi, ffi, fl, ffl..
  23.  
  24. Which is the not the same as Spanish CH or LL. Saying that ff is one
  25. letter is like saying Russian "bI" is two...
  26.  
  27. >why on the Earth do i need to spare bits for encoding glyphs if
  28. >i already know the language and 8 (or 16 for oriental languages) bits
  29. >is quite enough to map the alphabet. Don't you see this gap in
  30. >the logic nullifying all benefits of 10646?
  31.  
  32. What the hell has the number of bits to do with anything? Do computers
  33. exist for the programmers of the users?
  34.  
  35. >With a trivial trick of including several codes for identical glyphs
  36. >for letters from different languages you can put all of them in ONE
  37. >meta-alphabet.
  38.  
  39. Well that's is already done in 10646 for letters which are the same in
  40. Latin, Cyrillic and Greek scripts. Hopefully, that will not cause to
  41. much of a mess.
  42.  
  43. But what Vadim Antonov was discussing was including identical glyphs
  44. for languages like Swedish, German etc. I guess people are in for real
  45. surprises because things don't end up where they expect them because 
  46. they happen to use the wrong type of dotted A. Not talking about the 
  47. confusion they get when they are searching the text. Possibly this
  48. arrangement is friendly for the the lazy programmer Vadim Antonov, 
  49. but not for the poor user.
  50.  
  51. >ASCII is for English, period.
  52. >...
  53. >The semantic in ASCII is hard-coded -- it is the order of letters
  54. >and the trivial upper-case to lower-case convertion.
  55. >Unfortunately the move to abolish the last traces of semantic and
  56. >make it PURELY graphical format destroyed the usefulness of such
  57. >encoding for data processing.
  58.  
  59. In what way is ASCII, which is - as state yourself - for English,
  60. useful for data processing in German or French? Or even its
  61. semantics useful for these languages? In the poor variety of
  62. English you can render with ASCII, sorting can be based simply
  63. on the letter ordering, because accents, digraphs and diaeresis
  64. which only occurs occassionaly were left out. But German and
  65. French cannot be simplified in this ways because umlauts and
  66. accents appear much more often. For these languages the sorting
  67. algorithm must be more complex that simple sorting on collation
  68. order, so what's the use of a hard-coded semantics a la ASCII?
  69.  
  70. You are seeing the solution, simple bit-order comparisons. But
  71. unfortunately there are not many problems which have this solution.
  72. -- 
  73. Erland Sommarskog - ENEA Data, Stockholm - sommar@enea.se
  74. Jag gav en k{ck tjeck en check.
  75.