home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 961 < prev    next >
Encoding:
Internet Message Format  |  1992-12-31  |  3.0 KB

  1. Path: sparky!uunet!mcsun!sun4nl!cwi.nl!dik
  2. From: dik@cwi.nl (Dik T. Winter)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <8492@charon.cwi.nl>
  7. Date: 1 Jan 93 01:25:20 GMT
  8. References: <1hu9v5INNbp1@rodan.UU.NET> <8490@charon.cwi.nl> <1hvu79INN4qf@rodan.UU.NET>
  9. Sender: news@cwi.nl
  10. Organization: CWI, Amsterdam
  11. Lines: 47
  12.  
  13. In article <1hvu79INN4qf@rodan.UU.NET> avg@rodan.UU.NET (Vadim Antonov) writes:
  14.  > Dik, i never insisted that all European languages belong to
  15.  > the single group -- how many are the ISO Latin-X sets?
  16.  > My point was that there obviously are identifyable meta-alpahbets
  17.  > covering several languages.
  18. I do think that the number in several is very small.
  19.  > 
  20.  >            Or dutch, where the letter combination ij is sorted either
  21.  > >amongst i as a double letter, or amongst y as a single letter, or
  22.  > >between y and z as a single letter, depending on who does the sorting?
  23.  > 
  24.  > If a combination of letters is treated as a letter IT IS A LETTER.
  25.  > Then add it to the alphabet and let the keyboard driver (which surely
  26.  > knows the language -- simply because there are different keyboard
  27.  > layouts) to handle the matter.
  28. Still wrong.  Take the dutch ij.  I have one typewriter that has the ij
  29. on a single key, but all typewriters sold the last 20 years and all
  30. computer keyboards sold in the Netherlands are not specific dutch.  I
  31. would be surprised if there is even a large number of computer keyboards
  32. sold that is not US, UK or German.  So how would the keyboard driver deal
  33. with the 'ij' combination?  When I enter the combination it can either be
  34. the single letter ij (some dutch people say there is no such single letter),
  35. or two letters, depending on context.  So must the keyboard driver look
  36. at the context (e.g. it is a french loadnword like bijoux so that ij is
  37. really two letters), or what?
  38.  
  39. Sorting is extremely context sensitive, even in a single language.  As
  40. another person already mentioned in english you sort McNeill as if it
  41. is MacNeill.  Similar the abbreviation St. which can be either Street or
  42. Saint.  (Moreover, when sorting names I would prefer to sort C. van der Bilt
  43. under V if it is an American and under B if it is a Dutchman ;-).)
  44.  
  45. To me it appears very silly to put more than superficial sorting
  46. information in the encoding.  The remainder must be handled by the
  47. applications (through library programs).  And indeed, that may require
  48. table look-up.
  49.  > 
  50.  > The idea of visual encoding (and one letter-onr glyph is nothing more
  51.  > than a compressed image of the text) is simply wrong because it
  52.  > drops valuable information readily available at the point of the CREATION
  53.  > of the text but not later.
  54. But as I said, such information is not readily available at the point of
  55. creation, only if the system asks everytime.  That would be silly as most
  56. text is not sorted anyway.
  57. -- 
  58. dik t. winter, cwi, kruislaan 413, 1098 sj  amsterdam, nederland
  59. home: bovenover 215, 1025 jn  amsterdam, nederland; e-mail: dik@cwi.nl
  60.