home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1288 < prev    next >
Encoding:
Internet Message Format  |  1993-01-23  |  2.1 KB

  1. Path: sparky!uunet!mcsun!sun4nl!cwi.nl!dik
  2. From: dik@cwi.nl (Dik T. Winter)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Radicals Instead of Characters
  5. Message-ID: <8713@charon.cwi.nl>
  6. Date: 23 Jan 93 03:01:05 GMT
  7. References: <1jfgq1INNqmn@flop.ENGR.ORST.EDU> <2791@titccy.cc.titech.ac.jp> <1jpj9sINNlie@flop.ENGR.ORST.EDU>
  8. Sender: news@cwi.nl
  9. Organization: CWI, Amsterdam
  10. Lines: 34
  11.  
  12. In article <1jpj9sINNlie@flop.ENGR.ORST.EDU> crowl@jade.CS.ORST.EDU (Lawrence Crowl) writes:
  13. (removed all other attributions).
  14.  > >>The question I was asking was "can you _identify_ a han/kanji character
  15.  > >>based on a sequence of radicals"
  16.  > >
  17.  > >No, you can't. Radicals are for indexing only. The rest of the character
  18.  > >has its own complex shape.
  19.  > 
  20.  > If you can use radicals for indexing, then you can use them to identify
  21.  > characters.  The process of identifying a character need not be able
  22.  > to, by itself, generate an acceptable image.
  23. How come?  I can use the base letter A for indexing, it can not be used to
  24. identify the actual letter (which may have one or more diacritics floating
  25. around).  (Sorry you nordic people that I make a diacritic from the ring!)
  26.  > 
  27.  > An encoding every variant of every character ever written is not?  At
  28.  > 214 radicals, we can represent a radical in eight bits, and a character
  29.  > in 8*(average number of radicals per character).  Your non-unified
  30.  > approach would require roughly eighteen bits per character.
  31. As I understand it each character has only one radical.  (I learned that
  32. a character consists of a radical plus possibly additional strokes.)  You
  33. have the misunderstanding that a character is composed of a number of
  34. radicals.  (BTW, this is true of the Korean Hangul, but that is actually
  35. an alphabetic script, each base symbol represents a sound.)
  36.  > 
  37. ...
  38.  > Unique in what sense?  Examples?
  39. Unique in the sense that they do not contain radicals.
  40.  
  41. (And excuses to you Japanese, Chinese and Korean people for the inaccuracies
  42. I wrote.)
  43. -- 
  44. dik t. winter, cwi, kruislaan 413, 1098 sj  amsterdam, nederland
  45. home: bovenover 215, 1025 jn  amsterdam, nederland; e-mail: dik@cwi.nl
  46.