home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1266 < prev    next >
Encoding:
Internet Message Format  |  1993-01-21  |  1.8 KB

  1. Path: sparky!uunet!cs.utexas.edu!sun-barr!sh.wide!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  2. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: The ultimate encoding
  5. Message-ID: <2769@titccy.cc.titech.ac.jp>
  6. Date: 21 Jan 93 17:02:58 GMT
  7. References: <1iddeeINN58g@rodan.UU.NET> <1993Jan9.220818.25882@enea.se> <2677@titccy.cc.titech.ac.jp> <1993Jan10.103419.2364@enea.se>
  8. Sender: news@titccy.cc.titech.ac.jp
  9. Organization: Tokyo Institute of Technology
  10. Lines: 36
  11.  
  12. In article <1993Jan10.103419.2364@enea.se>
  13.     sommar@enea.se (Erland Sommarskog) writes:
  14.  
  15. >>If an application must neglect language difference, it can do so in the
  16. >>application.
  17. >
  18. >It must equalize all the umpteen instances, yes. And it better do if
  19. >the user is not going to be violent when he is told "you got the wrong
  20. >sort of 'W' here, please replace".
  21.  
  22. What? How do you think about a system which distigushes 'A's in
  23. Latin/Greek/Cyrillic and tells "you got the wrong sort of 'A' here,
  24. please replace"?
  25.  
  26. The system is just poorly desinged.
  27.  
  28. >But of course the application still
  29. >has to follow the language rules preferred by the user.
  30.  
  31. Applications just says there is something wrong in applications' own way.
  32. In good applications, the error messages should be smart. Then, users
  33. correct errors as they like. That's all.
  34.  
  35. >But then what's 
  36. >the point with all these umpteen instances?
  37.  
  38. For almost all purposes, there is only one correct instance.
  39.  
  40. But, sometimes, it is necessary to make ambiguious serach of, say,
  41. personal names in Han characters. Then, the language information should
  42. be dropped. BUT, at the same time, it is necessary to unify many characters
  43. which have different code points in Unicode. Many Han characters which
  44. have quite different forms share the common origin and should be
  45. considered equal for the ambiguious search.
  46.  
  47.                         Masataka Ohta
  48.