home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1323 < prev    next >
Encoding:
Internet Message Format  |  1993-01-26  |  5.2 KB

  1. Path: sparky!uunet!mcsun!sun4nl!cwi.nl!dik
  2. From: dik@cwi.nl (Dik T. Winter)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Alphabets
  5. Message-ID: <8732@charon.cwi.nl>
  6. Date: 26 Jan 93 02:02:43 GMT
  7. References: <1jutusINNlfa@life.ai.mit.edu> <8719@charon.cwi.nl> <1k100eINNs9n@life.ai.mit.edu>
  8. Sender: news@cwi.nl
  9. Organization: CWI, Amsterdam
  10. Lines: 81
  11.  
  12. In article <1k100eINNs9n@life.ai.mit.edu> glenn@wheat-chex.ai.mit.edu (Glenn A. Adams) writes:
  13.  > In article <8719@charon.cwi.nl> dik@cwi.nl (Dik T. Winter) writes:
  14.  > >"What is Unicode encoding?".  Scripts?  Writing system?
  15.  > Unicode encodes scripts, and not writing systems (alphabets).
  16. Good, but see later.
  17.  > 
  18.  > >Suetterlin.  Is that a different font?  Many would think the latter not
  19.  > >predominantly derived from the symbols used in the Roman alphabet.  I see
  20.  > >them as being more derived from the Germanic Runes.  Still, there is a 1<->1
  21.  > >corespondence between the symbols in the Suetterlin script and the German
  22.  > >version of the Latin script (I think).
  23.  > I assume you refer to the written form developed by von Ludwig Suetterlin
  24.  > (1865-1917).  I don't have any detailed information on it, so I can't say
  25.  > for sure.  Without knowing any details, I would be willing to say it was
  26.  > a distinct script to the extent that Suetterlin created new forms or even
  27.  > borrowed forms from other scripts, perhaps modifying them in the process.
  28. True enough.
  29.  > 
  30.  > Aside from the issue of encoding utility, I would say that abstracting the
  31.  > forms of two or more alphabets into a single script should take into account
  32.  > historical derivation, formal similarity, and perhaps even functional
  33.  > similarity, although I would give the much less priority than the former two
  34.  > criteria.
  35. In my opinion you can not give absolute criteria.  While Suetterlin is not
  36. derived from the Latin script and there is no formal similarity, it is
  37. functionally equivalent.  So, although it is in fact a different script it
  38. may just as well be viewed as a different font.  I do not think that Unicode
  39. (where it is extended to extinct scripts) should reserve codepoints for this
  40. script.  And I think many German people would agree.  This is were you can
  41. not ignore the culture and where functional equivalence takes priority.
  42. (I may note that this script has been used very extensively and that it
  43. was learned at schools still in the sixties.)
  44.  > 
  45.  > >I think you should add that unification of different scripts is possible
  46.  > >iff the scripts can be viewed as just being font changes (although the
  47.  > >derivation of the scripts can be completely different).
  48.  > 
  49.  > I think you may be confusing "script" as I am using it with "handwriting
  50.  > form" or possibly "written form."  Clearly the latter would be a matter of
  51.  > only font changes, and nothing more.
  52. No, I think not.  What I indicated was that functional equivalence (as you
  53. correctly stated it) might be the most important deciding factor for some
  54. scripts.
  55.  
  56.  > The general process used in Unicode is to identify an alphabet (i.e., the
  57.  > symbols used in a particular writing system) with some historically known
  58.  > collection of symbols (a script), attempt to unify the alphabet with the
  59.  > this collection, and, then, to the extent that the unification is successful
  60.  > and doesn't interfere with basic processing tasks, replace the script with
  61.  > the (unified) union of the original script and the forms of the new alphabet.
  62. But I think that the identification process may ignore the actual form.  When
  63. Suetterlin was used it was mixed with the normal Roman form without change of
  64. meaning.  It was more or less viewed as a different font, although the letter
  65. forms are completely different.
  66.  > 
  67.  >>So while you can unify the Suetterlin and the Latin script, you can not unify
  68.  >>Latin and Greek script although Latin is derived from Greek.
  69.  > 
  70.  > You could unify Latin and Greek if you want, but it would require radical
  71.  > unification of both form and function.
  72. So it would go against two of the three criteria you gave.  (Formal and
  73. functional similarity.  The derivation is there.)  I think the functional
  74. dissimilarity is the more important here, the formal dissimilarity is not
  75. so very great; the same holds for Latin and Cyrillic.
  76.  >                                         And it wouldn't buy much as far
  77.  > as encoding is concerned.
  78. But that is only an afterthought.  How about the Turkish I with and without
  79. dot?  It would not have cost much to give them separate coding points.  (Yes,
  80. I understand the compatibility reasons.  Are there other reasons?)
  81.  
  82. What I think about scripts is that the LGC scripts have two distinctive forms
  83. (majuscule and minuscule) that must be observed.  When coding a LGC symbol
  84. you actually require two coding points, and when looking for similarities
  85. you have to observe both variants.  So because there are not many symbols
  86. involved, it pays to *not* unify LGC (there are only a few letters that
  87. are similar in both cases).  Now I do not know in how far the Kannada and
  88. Telugu scripts are Unified (as I said the book was sold out when I tried to
  89. buy it), but I think those have the same distinctions as Latin and Greek.
  90. -- 
  91. dik t. winter, cwi, kruislaan 413, 1098 sj  amsterdam, nederland
  92. home: bovenover 215, 1025 jn  amsterdam, nederland; e-mail: dik@cwi.nl
  93.