home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 933 < prev    next >
Encoding:
Internet Message Format  |  1992-12-27  |  5.4 KB

  1. Path: sparky!uunet!gossip.pyramid.com!olivea!spool.mu.edu!yale.edu!ira.uka.de!fauern!uni-erlangen.de!not-for-mail
  2. From: unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn)
  3. Newsgroups: comp.std.internat
  4. Subject: An alternative I18N paradigm
  5. Message-ID: <1hkff3EINN5uv@uni-erlangen.de>
  6. Date: 27 Dec 92 14:43:47 GMT
  7. References: <24479@alice.att.com>
  8. Reply-To: mskuhn@immd4.informatik.uni-erlangen.de
  9. Organization: Regionales Rechenzentrum Erlangen
  10. Lines: 96
  11. NNTP-Posting-Host: cd4680fs.rrze.uni-erlangen.de
  12.  
  13. andrew@alice.att.com (Andrew Hume) writes:
  14.  
  15. >the problem is that there is no good model for doing i18n.
  16. >Locales, in this sense, are a complete and utter mistake.
  17. [...]
  18. >    i feel obliged to give an example. locales seem to have an
  19. >underlying model that a user doing processing is doing that processing
  20. >in some local context (locale) with a number of conventions and rules
  21. >governing that processing. if this was all that happened, we'd be in
  22. >good shape. but hey, what about networking? there are two problems
  23. >here. one is almost trivial; suddenly ``local'' is undefined.
  24. >if i'm in berlin and rlogin to paris, which locale should i use?
  25. >(i think the answer is that the question is wrong; this use of locale
  26. >amounts to saying ``i want to view the world and all data i see through
  27. >a specific filter (locale)'' and the answer is the locale i am
  28. >familiar with.)
  29.  
  30. What do you think about this approach: "Don't try to use locale filters,
  31. where this seems to be inappropriate (e.g. in a network environment).
  32.  
  33. I agree with you, that locales are a fine thing if you work only in a 
  34. local environment (e.g. use your computer to write German letters, get
  35. German error messages, have German names in a database, ...).
  36.  
  37. If you use your system in an international environment, then you will
  38. always have serious troubles with the approach of selecting the right
  39. filters. People will be presented the same information in different formats
  40. and no one knows which output format is offered to the recipient.
  41. This will surely cause a lot of confusion in many situations.
  42. (E.g., it look's awful, if I get an english letter in a tagged format
  43. (say SGML), and my mail browsers replaces the date by the German notation.
  44. Here selecting the correct date format would have to be determined by
  45. a non-trivial algorithm or table from both the language used in the letter
  46. the country in which it has been written, the country to which it has been
  47. sent and the language used by the recipient.)
  48.  
  49. The real solution is much simpler: Let's define an internationally acceptable
  50. human representation for all kinds of information and don't try to
  51. cover local customs in networking software. The introduction of computers
  52. has already caused a lot of changes in the traditional ways we
  53. represent information (e.g. the decimal point is already an accepted
  54. alternative to the traditional decimal comma in Germany and it looks
  55. strange if a system with locales uses the traditional decimal comma, as
  56. everyone already expects that computers all over the world use decimal
  57. points.)
  58.  
  59. You may call this approach also defining an "international locale" which
  60. is the highly recommended default setting all over the world. Today, the
  61. US locale is already used in this way very often, but some major points
  62. have to be changed in it, before it is really internationally acceptable.
  63.  
  64. I suggest that this international local should use existing ISO standards
  65. where possible. Some conventions for this international locale might be
  66.  
  67.   - use the metric system (SI units)
  68.   - use ISO paper sizes (e.g. A4, C5, ...)
  69.   - a character encoding based on ISO 10646 (not US-ASCII)
  70.   - use the US representation for decimal numbers
  71.   - use the ISO 8601 format for dates (e.g. 1992-12-27)
  72.   - use the ISO 8601 format for times (the 24h system, no am/pm)
  73.   - use the ISO 8601 format for time zones (i.e. +0100 in stead of MET)
  74.   - an international acceptable sorting based on a sorting table for
  75.     ISO 10646
  76.   - ... (additional suggestions are welcome)
  77.  
  78. Good solutions are simple solutions and the concept of one single international
  79. locale is much simpler that anything else. The current situation in the
  80. computing industry is already the proof for the fact, that users are willing
  81. to accept changes in their traditional local conventions if they have any
  82. benefit from it. International computer communication seems to be an
  83. benefit high enough. The benefit of making the way free for using the
  84. same conventions all over the world even outside computer networks is
  85. another one.
  86.  
  87. With this approach, selecting the language for dialogue messages would be
  88. the only change that has to be made between different environments and
  89. even here, English has already proofen to be an acceptable default.
  90. (And of course the time zone ...)
  91.  
  92. In this sense, I18N should be defined as the work that is necessary to
  93. migrate from the currently used US conventions to one single
  94. internationally acceptable set of conventions (locale).
  95.  
  96. This solution for internationalization is so simple that I wonder, why
  97. still so many people are working on much more complicated systems that
  98. will never give a perfect solution.
  99.  
  100. Is my analysis really too naive?
  101.  
  102. Markus
  103.  
  104. -- 
  105. Markus Kuhn, Computer Science student -=-=- University of Erlangen, Germany
  106. Internet: mskuhn@immd4.informatik.uni-erlangen.de  |  X.500 entry available
  107. ----- Anyone participating in the use of MS-DOS, Heroin or Cocaine is -----
  108. ---- simply not getting the most out of life possible. (Brian Downing) ----
  109.