home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / unix / bsd / 10659 < prev    next >
Encoding:
Internet Message Format  |  1992-12-27  |  3.7 KB

  1. Xref: sparky comp.unix.bsd:10659 comp.os.linux:21839
  2. Path: sparky!uunet!munnari.oz.au!spool.mu.edu!sdd.hp.com!cs.utexas.edu!sun-barr!sh.wide!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  3. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  4. Newsgroups: comp.unix.bsd,comp.os.linux
  5. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  6. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  7. Message-ID: <2564@titccy.cc.titech.ac.jp>
  8. Date: 27 Dec 92 18:47:12 GMT
  9. References: <id.M2XV.VTA@ferranti.com> <1992Dec18.043033.14254@midway.uchicago.edu> <1992Dec18.212323.26882@netcom.com> <1992Dec19.083137.4400@fcom.cc.utah.edu>
  10. Sender: news@titccy.cc.titech.ac.jp
  11. Followup-To: comp.unix.bsd
  12. Organization: Tokyo Institute of Technology
  13. Lines: 73
  14.  
  15. In article <1992Dec19.083137.4400@fcom.cc.utah.edu>
  16.     terry@cs.weber.edu (A Wizard of Earth C) writes:
  17.  
  18. >US Engineers produce software for the available market; because of the
  19. >input difficulties involved in 6000+ glyph sets of symbols, there has been
  20. >a marked lack of standardization in Japanese hardware and software. This
  21. >means that the market in Japan consists of mostly "niche" markets, rather
  22. >than being a commodity market.
  23.  
  24. Do you know what Shift JIS is? It's a defacto standard for charcter encoding
  25. established by microsoft, NEC, ASCII etc. and common in Japanese PC market.
  26.  
  27. Now, DOS/V from IBM strongly supports Shift JIS.
  28.  
  29. In the workstation market in Japan, some supports Shift JIS, some
  30. supports EUC and some supports both. Of course, many US companies
  31. sell Japanized UNIX on thier workstations.
  32.  
  33. >This has changed somewhat with the Nintendo
  34. >corporations recent successes in Japan, where standardized hardware is
  35.  
  36. I'm sure you are just joking here.
  37.  
  38. >Microsoft has adopted Unicode as a standard.  It will probably be the
  39. >prevalent standard because of this -- the software world is too wrapped
  40. >up in commodity (read "DOS") hardware for it to be otherwise.  Unicode
  41. >has also done something that XPG4 has not: unified the Far Eastern and
  42. >all other written character sets in a single font, with room for some
  43. >expansion (to the full 16 bits) and a discussion of moving to a full
  44. >32 bit mechanism.
  45.  
  46. Do you know that Japan vote AGAINST ISO10646/Unicode, because it's not
  47. good for Japanese?
  48.  
  49. >So even if the Unicode standard ignores backward compatability
  50. >with Japanese standards (and specific American and European standards),
  51. >it better supports true internationalization.
  52.  
  53. The reason of disapproval is not backward compatibility.
  54.  
  55. The reason is that, with Unicode, we can't achieve internationalization.
  56.  
  57. >XPG4, by adopting the JIS standard, appears to be
  58. >igonoring HAN (Chinese) and many other languages covered by the Unicode
  59. >standard.
  60.  
  61. Unicode can not cover both Japanese and Chinese at the same time, because
  62. the same code points are shared between similar characters in Japan
  63. and in China.
  64.  
  65. Of course, it is possible to LOCALIZE Unicode so that it produces
  66. Japanese characters only or Chinese characters only. But don't we
  67. need internationalization?
  68.  
  69. Or, how can I process a text containing both Japanese and Chinese?
  70.  
  71. >I think that Japaneese
  72. >users (and European and American users, if nothing is done about storage
  73. >encoding to 8 bit sets) are going to have to live with the drawbacks of
  74. >the standard for a very long time (the primary one being two 16K tables
  75. >for input and output for each language representable in 8 bits, and two
  76. >16k tables for runic mapping for languages, like Japaneese, which don't
  77. >fit on keyboards without postprocessing).
  78.  
  79. What? 16K? Do you think 16K is LARGE?
  80.  
  81. Then, you know nothing about how Japanese are input. We are happily using
  82. several hundreds kilo bytes or even several mega bytes of electrical
  83. dictionary, even on PCs.
  84.  
  85. Who, do you think, is the dumb American?
  86.  
  87.                             Masataka Ohta
  88.