home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1305 < prev    next >
Encoding:
Text File  |  1993-01-24  |  3.1 KB  |  72 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!zaphod.mps.ohio-state.edu!magnus.acs.ohio-state.edu!usenet.ins.cwru.edu!agate!dog.ee.lbl.gov!hellgate.utah.edu!fcom.cc.utah.edu!cs.weber.edu!terry
  3. From: terry@cs.weber.edu (A Wizard of Earth C)
  4. Subject: Re: Cleanicode
  5. Message-ID: <1993Jan25.001633.29534@fcom.cc.utah.edu>
  6. Sender: news@fcom.cc.utah.edu
  7. Organization: Weber State University  (Ogden, UT)
  8. References: <ISHIKAWA.93Jan20182546@ds5200.personal-media.co.jp> <1993Jan21.001303.20834@fcom.cc.utah.edu> <ISHIKAWA.93Jan21204416@ds5200.personal-media.co.jp>
  9. Date: Mon, 25 Jan 93 00:16:33 GMT
  10. Lines: 60
  11.  
  12. In article <ISHIKAWA.93Jan21204416@ds5200.personal-media.co.jp> ishikawa@personal-media.co.jp writes:
  13. >   The problem is one of an existing character sets having multiple
  14. >   possible reverse translations of a single code point.
  15. >
  16. >   A similar condition would be a Japanese/Chinese character set standard
  17. >   which had seperate code points for characters unified by Unicode; if
  18. >   such existed, then there would be no round-trip for characters translated
  19. >   from that character set to the Unicode character set -- the correct code
  20. >   point within the Japanese/Chinese combined set could not be identified
  21. >   by the Unicode character itself.  No such example exists.
  22. >
  23. >I am an ignorant programmer. So bear with me. There is no such
  24. >example, is there?  [From what I heard, strictly hearsay, mind you,
  25. >there seem to be a few characters that would look slightly differently
  26. >on printed paper and yet were put into the same code point. This
  27. >slight difference might be big enough for some to scream and small
  28. >enough for others to ignore.  If someone knowledgeable could shed some
  29. >light on this mattter, I would be grateful.]
  30.  
  31. This is only true if the "round-tripping" were done from a character
  32. recognition standpoint, where the input character could not be recognized
  33. becuase of it being drawn differently.  While I can think of several
  34. examples here, they are pretty much non-applicable because the seperation
  35. of the rendering engine technology from the storage and process coding
  36. of the data.
  37.  
  38. A particular example would be a font with both Chinese and Japanese
  39. characters which did not chare code points, ie:
  40.  
  41.     --------        --------
  42.  
  43.       ----            ----  
  44.  
  45.     --------        --------
  46.  
  47.     0x9915            0x9272
  48.     (Japanese)        (Chinese)
  49.  
  50.  
  51. I don't believe such a font exists.  It's possible to create one, but
  52. unless it ends up widely accepted, I expect that this would not impact
  53. future revisions of Unicode.
  54.  
  55. >Wonder if there was such combined
  56. >Latin/Cyrillic/Greek standard at the time of Unicode design.
  57.  
  58. ISO 8859-5 and IS 8859-7 seem to me to qualify.
  59.  
  60.  
  61.                     Terry Lambert
  62.                     terry@icarus.weber.edu
  63.                     terry_lambert@novell.com
  64. ---
  65. Any opinions in this posting are my own and not those of my present
  66. or previous employers.
  67. -- 
  68. -------------------------------------------------------------------------------
  69.                                         "I have an 8 user poetic license" - me
  70.  Get the 386bsd FAQ from agate.berkeley.edu:/pub/386BSD/386bsd-0.1/unofficial
  71. -------------------------------------------------------------------------------
  72.