home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / unix / bsd / 10511 < prev    next >
Encoding:
Internet Message Format  |  1992-12-22  |  2.7 KB

  1. Xref: sparky comp.unix.bsd:10511 comp.os.linux:21296
  2. Newsgroups: comp.unix.bsd,comp.os.linux
  3. Path: sparky!uunet!mcsun!sun4nl!freya.let.rug.nl!thor!s0356514
  4. From: s0356514@let.rug.nl (H.H. Bergman)
  5. Subject: Re: UNICODE (was Dumb Americans (was INTERNATIONALIZATION:...)
  6. Message-ID: <1992Dec21.194942.16107@let.rug.nl>
  7. Sender: news@let.rug.nl (news manager)
  8. Nntp-Posting-Host: thor.let.rug.nl
  9. Organization: Faculteit der Letteren, Rijksuniversiteit Groningen, NL
  10. X-Newsreader: TIN [version 1.1 PL6]
  11. References: <1992Dec18.165905.8414@unislc.uucp>
  12. Date: Mon, 21 Dec 1992 19:49:42 GMT
  13. Lines: 47
  14.  
  15. Ed Carp (erc@unislc.uucp) wrote:
  16. : Richard L. Goerwitz (goer@kimbark.uchicago.edu) wrote:
  17. : : One of the big criticism leveled at US Engineers is that they are either
  18. : : too dumb or lazy to build into their software support for non-Western
  19. : : scripts.
  20. : I'd be more than happy to build internationalization into my code, if I knew how
  21. : to do it... <sigh>
  22. Plan 9 supports Unicode/UTF. They have postscript manuals available somewhere
  23. too. Unicode uses 16 bit characters with the usual 7-bit ASCII set included
  24. in the beginning. UTF is a special encoding that is compatible with normal
  25. 7-bit ASCII files, as long as you use only the regular ASCII chars. For
  26. higher characters it uses a multibyte sequence.
  27. The problem with Unicode is of course, that to support it fully, you'll need
  28. to adapt all existing programs. [And displaying non-ascii characters on a 
  29. simple terminal is out of the question.]
  30.  
  31. There are two books published by the Unicode Consortium that describe
  32. the unicode standard. I've only seen the second part, but from reading
  33. that, the first part seems to be pretty essential. They cost about $40
  34. here each, I think, so I haven't bought them yet.
  35.  
  36. It would be possible to map a subset of the Unicode characters to ASCII or
  37. Latin-1 in order to display tex on simple non-graphic terminals. 
  38. Xwindows seems to support 16-bit characters too, but I have no
  39. info about that at all.
  40.  
  41. *Lots* [I dare say, nearly every C program in existence] of programs
  42. assume sizeof(char)=1 byte.  With Unicode this is no longer true, causing
  43. lots of problems for characters > 127.
  44.  
  45. If enough people want this, I may consider writing a support library for
  46. Unicode/UTF to provide basic manipulations. [But I'll first have to do
  47. some more hacking on my QIC-02 driver...] Somebody want to donate Unicode
  48. fonts to GNU? [They also need other free fonts btw.]
  49.  
  50. Once the GNU text/file/bin utils support Unicode/UFT, others will probably
  51. follow, but it would still require *lots* of effort.
  52.  
  53. Linus, how would you feel about having Unicode support in the kernel?
  54. Having Unicode filenames would be really cool. ;-)
  55.  
  56. : -- 
  57. : Ed Carp            erc@apple.com, erc@saturn.upl.com    801/538-0177
  58.  
  59. --Hennus Bergman
  60.