home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / unix / bsd / 10679 < prev    next >
Encoding:
Text File  |  1992-12-28  |  3.3 KB  |  68 lines

  1. Newsgroups: comp.unix.bsd
  2. Path: sparky!uunet!spool.mu.edu!agate!dog.ee.lbl.gov!hellgate.utah.edu!fcom.cc.utah.edu!cs.weber.edu!terry
  3. From: terry@cs.weber.edu (A Wizard of Earth C)
  4. Subject: Re: INTERNATIONALIZATION: JAPAN, FAR EAST
  5. Message-ID: <1992Dec28.064029.24421@fcom.cc.utah.edu>
  6. Sender: news@fcom.cc.utah.edu
  7. Organization: University of Utah Computer Center
  8. References: <1992Dec18.235809.15484@midway.uchicago.edu> <agp22+#@rpi.edu> <1gvpt0INN8s0@hrd769.brooks.af.mil> <BzIwvu.3BE@demon.co.uk> <CARLTON.92Dec21163548@scws8.harvard.edu> <2565@titccy.cc.titech.ac.jp>
  9. Date: Mon, 28 Dec 92 06:40:29 GMT
  10. Lines: 56
  11.  
  12. In article <2565@titccy.cc.titech.ac.jp>, mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  13. |> In article <CARLTON.92Dec21163548@scws8.harvard.edu>
  14. |>     carlton@scws8.harvard.edu (david carlton) writes:
  15. |> 
  16. |> >I certainly wouldn't call it an insignificantly larger market.  Huge
  17. |> >numbers of people use Chinese, Japanese, and other languages whose
  18. |> >scripts don't fit in 8 bits, after all.
  19. |> 
  20. |> True. But, it should be noted that they don't fit even in 16 bits.
  21.  
  22. Work is already under way to adapt Unicode to 32 bits.  I would be interested
  23. in any similar work you know of in progress for XPG4/JIS.  I am *not*
  24. interested in proposing or attempting to provide yet another standard, if
  25. that is what you believe is necessary.
  26.  
  27. |> Even character sets used in a single language can not be represented
  28. |> with 16 bits.
  29. |> 
  30. |> While not all characters are used in modern Japanese, Taiwan already have
  31. |> a character encoding standard which contains more than 65536 Han
  32. |> characters.
  33.  
  34. 0-65535 is 65536 characters, and is capable of being contained in an unsigned
  35. short (16 bits).  I agree that this would leave no room for other characters
  36. from other languages, but I doubt that all of these characters are in modern
  37. use in a single dialect of Chinese.  In any case, the 32-bit Unicode should
  38. have no problem handling the symbols.  I am more concerned with ligatures,
  39. and I suspect there isn't a mechanism for doing this (short of an Arabic
  40. or other ligature-bound language terminal).  Certainly our proposed mechanism
  41. of X can not handle this within the bounds of its current font mechanisms,
  42. nor can, I believe, Display Postscript, as on the NeXT.  Postscript is not
  43. an alternative, given the nature of the 386BSD project and the licensing
  44. restrictions glued to Postscript.
  45.  
  46. |> >Whether it is worth the
  47. |> >effort to you is another matter, though;
  48. |> 
  49. |> Sure. But if you do something, do it throughly, so that you don't have
  50. |> to do it twice.
  51.  
  52. Again, I want to stress that we are about the identification and adoption
  53. of an existing standard rather than the specification and ratification of
  54. a new one.  We may invoke "tricks" to reduce storage requirements or to
  55. retrofit existing input mechanisms, but we are not attempting a new standard.
  56.  
  57.  
  58.                     Terry Lambert
  59.                     terry@icarus.weber.edu
  60.                     terry_lambert@novell.com
  61. ---
  62. Any opinions in this posting are my own and not those of my present
  63. or previous employers.
  64. -------------------------------------------------------------------------------
  65.                                         "I have an 8 user poetic license" - me
  66.  Get the 386bsd FAQ from agate.berkeley.edu:/pub/386BSD/386bsd-0.1/unofficial
  67. -------------------------------------------------------------------------------
  68.