home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 987 < prev    next >
Encoding:
Text File  |  1993-01-02  |  3.5 KB  |  72 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!mcsun!news.funet.fi!hydra!klaava!wirzeniu
  3. From: wirzeniu@klaava.Helsinki.FI (Lars Wirzenius)
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <1993Jan2.020512.3287@klaava.Helsinki.FI>
  6. Keywords: ISO10646 Unicode
  7. Organization: University of Helsinki
  8. References: <1i13rrINNars@rodan.UU.NET> <id.68CW.A16@ferranti.com> <1i2m57INN4vr@rodan.UU.NET>
  9. Date: Sat, 2 Jan 1993 02:05:12 GMT
  10. Lines: 60
  11.  
  12. avg@rodan.UU.NET (Vadim Antonov) writes:
  13. >The problem is not in searching -- the problem is in presenting
  14. >the information and in regular expressions ([a-z] - does it include "o?)
  15.  
  16. Wrong question.  The correct question is: Which "o letters does [a-z]
  17. include, if any?
  18.  
  19. Germans have "a after a and "o after o (or so I remember from when I
  20. knew some German, about five years ago), Swedes and Finns have them
  21. after z.  So, should [a-z] include the German letters or not?
  22.  
  23. The answer is that it depends.  If I'm using the German alphabet, they
  24. should be included, but if I'm using the Swedish one, they should not
  25. be included.
  26.  
  27. So, how does the stupid thing know which alphabet we're using?  Either
  28. we tell it to it explicitly (which Vadim seems to abhor), or we use
  29. completely separate codes for each and every letter of each and every
  30. language, so that the Swedish a and z are different from the German a
  31. and z.  The latter solution is ugly (IMHO), since it causes things
  32. that are universally considered to be one to become many and that only
  33. makes trouble.  The latter solution also is not going to happen, I
  34. think.
  35.  
  36. >Let's solve simplier problems first. I merely want a character set
  37. >which allows me to use my screen editor without fussing around
  38. >every search pattern i use.
  39.  
  40. If I understand your proposed solution correctly, it is the "each
  41. language has a completely different set of character codes" solution
  42. which I have disagreed with above.
  43.  
  44. Now, I can easily understand that it works when the two languages are
  45. like English and Russian, i.e. they use completely different alphabets
  46. that only happen to have a couple of letters that _look_ the same (but
  47. are still quite different characters, from what I understand; I have
  48. no objection of the Unicode designer being flogged if they mix
  49. Cyrillic and Latin letters :-).  It does not work very well when using
  50. languages that have almost the same alphabets, with only a few letters
  51. differing, such as Swedish and German.
  52.  
  53. Just the input problem is enough to kill this idea, I think: The user
  54. would have to get the language of every character he types correct,
  55. and as somebody who routinely (as in usually large amounts every day)
  56. enters text in several languages (English, Swedish, and Finnish, with
  57. a few quoted words every now and then from a number of other
  58. languages, including German, Latin, and French) and often enough mixes
  59. several languages in one sentence, let me tell you that it is _not_
  60. going to succeed.  Having to switch language mode every few words, or
  61. for every different document, is not going a workable solution.
  62.  
  63. The user is also going to have a hard time differentiating between
  64. identically looking letters in different languages.  On fancy graphics
  65. terminals one might use fonts or something to aid this, but that does
  66. not exactly make for WYSIWYG, or even minimally good looking screens.
  67. There is no such option for those of us using text-only terminals.
  68.  
  69. --
  70. Lars.Wirzenius@helsinki.fi  (finger wirzeniu@klaava.helsinki.fi)
  71.    MS-DOS, you can't live with it, you can live without it.
  72.