home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 948 < prev    next >
Encoding:
Internet Message Format  |  1992-12-31  |  2.6 KB

  1. Path: sparky!uunet!gatech!emory!wupost!spool.mu.edu!yale.edu!yale!mintaka.lcs.mit.edu!ai-lab!wheat-chex!glenn
  2. From: glenn@wheat-chex.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Data tagging (was: 8-bit representation, plus an X problem)
  5. Date: 31 Dec 1992 07:15:08 GMT
  6. Organization: MIT Artificial Intelligence Laboratory
  7. Lines: 39
  8. Message-ID: <1hu6lsINN773@life.ai.mit.edu>
  9. References: <ISHIKAWA.92Dec22180817@ds5200.personal-media.co.jp> <24479@alice.att.com> <2563@titccy.cc.titech.ac.jp>
  10. NNTP-Posting-Host: wheat-chex.ai.mit.edu
  11.  
  12. In article <2563@titccy.cc.titech.ac.jp> mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  13. >
  14. >I heard that, microsoft's NT will have a locale mechanism so that
  15. >it can print Japanes Han as Japanese and Chinese Han as Chinese,
  16. >which is impossible with bare 10646/Unicode.
  17. >
  18. >Then, how can we have a file containing both Japanese and Chinese?
  19. >
  20.  
  21. Ohta-san is making much too much about this issue.  First, there is
  22. much less difference between a Chinese font's rendition of a given Han
  23. character and a Japanese font's rendition of the same character than
  24. he seems to imply here.  Indeed, in practice, it is merely a matter of
  25. a font difference.  Furthermore, should a Japanese reader see a 10646
  26. Han character displayed with a Chinese font, or, should a Chinese reader
  27. see it with a Japanese font, it will still be legible in general.
  28.  
  29. If one wants a 10646 encoded text containing a mixture of Chinese and
  30. Japanese to be displayed using different fonts for the Chinese and Japanese
  31. parts, then a higher level protocol (rich text) must supply the information
  32. needed to determine which text is Chinese and which is Japanese.  This can
  33. be accomplished indirectly by using font runs, or directly by using some
  34. form of language tagging.
  35.  
  36. This is no different from wanting to display English text with a mixture
  37. of regular and italic faces.  10646 can't tell you which characters should
  38. be displayed with an italic font either.  The key point is that, in the
  39. absence of font shift information, one can still read the text.  Since this
  40. is also true in the mixed Chinese/Japanese case, it is an equivalent problem.
  41. 10646/Unicode properly encodes only the "plain text" information which
  42. allows for legible display.  Applications which desire more sophisticated
  43. display will have to add other "rich text" information necessary for the
  44. control of such advanced display.  The Unicode plain text model considers
  45. display with multiple fonts to be a sophisticated display requiring
  46. appropriate font tagging or other data (e.g., language tags) which allows
  47. the proper font to be selected.
  48.  
  49. Glenn Adams
  50. Cambridge, Massachusetts
  51.