home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / os / linux / 22009 < prev    next >
Encoding:
Text File  |  1992-12-29  |  4.1 KB  |  104 lines

  1. Newsgroups: comp.os.linux
  2. Path: sparky!uunet!math.fu-berlin.de!news.th-darmstadt.de!minnie!wilbur!ckurs-2
  3. From: ckurs-2@wilbur.uni-mainz.de (Teilnehmer am C-Kurs WS 1992_93)
  4. Subject: Unicode (was RE: DUMB ....)
  5. Message-ID: <OZ09MMB@minnie.zdv.uni-mainz.de>
  6. Keywords: Unicode UCS
  7. Sender: ckurs-2@wilbur (Teilnehmer am C-Kurs WS 1992_93)
  8. Nntp-Posting-Host: wilbur
  9. Organization: Johannes Gutenberg Universitaet Mainz
  10. Date: Tue, 29 Dec 1992 11:11:26 GMT
  11. Lines: 91
  12.  
  13. After reading all those flames on dumb people and standards i remembered an
  14. article about UCS and Unicode which was published by the german magazine c't in
  15. its Sept. 1992 issue.
  16.  
  17. So i have to make some corrections here on all that stuff that was posted:
  18.  
  19. 1. Unicode is only a subset of UCS, which calls for 32 bit chars.
  20. 2. Implementing UCS can not be so simple, since the standard documents need over
  21.    700 pages to describe only the Unicode subset!
  22.  
  23. BUT:
  24.  
  25. I think a first step can be done towards internationalization by commiting
  26. ourselfes to use an internal 32 bit char format in all our applications. That
  27. should cause no trouble, because the first 256 chars of Unicode/UCS are those of 
  28. the ISO-Latin1 charset. If we act that way, there should be no problem in
  29. upgrading the code to Unicode/UCS (I hope so!)
  30.  
  31. Somebody pointed to the difficulties for east asian user with the unicode set.
  32. Well, i can not judge on that, but i think if we use the 32 bit UCS there should
  33. be no problem at all and surely the east asian countries will come up with a code
  34. plateau of their own to solve that problem.
  35.  
  36. What is a very important point about Unicode/UCS, is the support of typographic
  37. symbols and markers for different writing directions and standard format symbols.
  38. That should end the confusion with the document formats rather soon. Also there
  39. is an easy way to detect wether a document was created on a little endian or a
  40. big endian machine (which is very important when you use multi byte characters!)
  41.  
  42. Before the flames are continuing, I recommend that all intrested parts read one
  43. or more of the following sources:
  44.  
  45. First the official documents (i haven't read them :-( )
  46.  
  47. The Unicode Consortium:
  48.     The Unicode Standard 1.0
  49.     Addison-Wessley, Reading, Mass. 1991
  50.  
  51. ISO/IEC:
  52.     Information technology - Universal Multiple-Octet Coded Character Set(UCS)
  53.     Part 1: Architecture and Basic Multilingual Plane, (DIS 10646-1.2)
  54.     Beuth-Verlag, Berlin 1992
  55.  
  56. Second publications in computer magazines:
  57.  
  58. Kenneth M. Sheldon:
  59.     ASCII Goes Global
  60.     Byte, July 1991, p. 108
  61.  
  62. Bernd Behr:
  63.     Welt der Zeichen - Neuer Zeichensatzstandard der ISO
  64.     c't - magazin f\"ur computertechnik, September 1992, p. 241
  65.  
  66.     Zeichen im Wandel - Textkonverter f\"ur 16-Bit- und andere Zeichens\"atze
  67.     c't - magazin f\"ur computertechnik, September 1992, p. 234
  68.  
  69. The last article describes a charcode converter between:
  70.     Amiga, 
  71.     Archimedes, 
  72.     Atari-ST, 
  73.     NeXT (adobe fonts), 
  74.     Macintosh,
  75.     IBM-PC (codepage 437),
  76.     Windows-ANSI,
  77.     OS/2 (codepage 850),
  78.     ASCII 7-Bit and
  79.     Unicode (well not the complete Unicode, but enough for Europe/America)
  80.  
  81. This code-converter is implemented in GfA-BASIC 3.07 and if i got my keyboard
  82. problems solved, then i will try to port it to gcc/linux.
  83. All c't- and iX-Listings are available via anonymous-ftp from:
  84.     ftp.uni-paderborn.de
  85.     ftp.uni-regensburg.de
  86.     clio.rz.uni-duesseldorf.de (only after 18.00 h central european time!)
  87.     ftp.zrz.tu-berlin.de
  88. (Sorry, i don't know the exact locations :-()
  89.  
  90. The c't magazine (and therefore possibly the author of those 2 articles ?)
  91. can be reached via eMail as: ct@ix.de
  92.  
  93. Happy New Year!
  94.  
  95. Dominik
  96. +-----------------------------------------------------------------------------+
  97. | eMail to:      kubla@MZDMZA.ZDV.UNI-MAINZ.DE                                |
  98. | sMail to:      Dominik Kubla, Steinsberg 34, 5428 Nastaetten, GERMANY       |
  99. +-----------------------------------------------------------------------------+
  100. |                                                                             |
  101. |                     I don't  *like*  LINUX, I  *LOVE*  it ...               |
  102. |                                                                             |
  103. +-----------------------------------------------------------------------------+
  104.