home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 979 < prev    next >
Encoding:
Text File  |  1993-01-01  |  2.2 KB  |  53 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!psinntp!ficc!peter
  3. From: peter@ferranti.com (peter da silva)
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <id.68CW.A16@ferranti.com>
  6. Keywords: ISO10646 Unicode
  7. Organization: Xenix Support, FICC
  8. References: <1hvu79INN4qf@rodan.UU.NET> <1i0oj2INNp4v@life.ai.mit.edu> <1i13rrINNars@rodan.UU.NET>
  9. Date: Fri, 1 Jan 1993 23:19:06 GMT
  10. Lines: 41
  11.  
  12. In article <1i13rrINNars@rodan.UU.NET> avg@rodan.UU.NET (Vadim Antonov) writes:
  13. > We were talking about lexicographical sorting, not abouth phonetics.
  14.  
  15. But lexicographic sorting (actually, lexicograhic ordering) is a minor part of
  16. this. Most sorting computers do is algorithmic ordering, to optimise some
  17. combination of operations on data structures (searching, for example). The
  18. character set is irrelevant there.
  19.  
  20. > Then you KNOW that it is compressed graphical format -- which is
  21. > essentially useless in anything except for storing and then reproduction
  22. > of the text.
  23.  
  24. Yes.
  25.  
  26. > What makes encoded text useful is that its encoding extracts
  27. > some SEMANTIC allowing for mechanical processing (particularly sorting).
  28.  
  29. OK, I want a character set that differentiates a word (if) between a C language
  30. keyword (if(...)), command line options (dd if=...), and English text (if you
  31. pass this way again...).
  32.  
  33. I want a character set that differentiates between parts of speech.
  34.  
  35. I want a character set that differentiates between running text, "quoted
  36. running text", EMPHASISED RUNNING TEXT, references(1), Proper Nouns, and
  37. <courier>computer text</courier>.
  38.  
  39. You don't want a character set. You want an SGML DTD.
  40.  
  41. > The semantic in ASCII is hard-coded -- it is the order of letters
  42. > and the trivial upper-case to lower-case convertion.
  43.  
  44. <para><sentence><phrase>The semantic in <acronym>ASCII</> is <jargon>
  45. hard-coded</></><dash><phrase>it is the <phrase>order of letters</>
  46. and <phrase>the trivial <jargon>upper-case</> to <jargon>lower-case</>
  47. conversion</></></sentence></para>
  48. -- 
  49. Peter da Silva                                            `-_-'
  50. Ferranti International Controls Corporation                'U` 
  51. Sugar Land, TX  77487-5012 USA
  52. +1 713 274 5180                            "Zure otsoa besarkatu al duzu gaur?"
  53.