home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 994 < prev    next >
Encoding:
Internet Message Format  |  1993-01-02  |  2.6 KB

  1. Path: sparky!uunet!pipex!bnr.co.uk!uknet!mcsun!sunic!seunet!enea!sommar
  2. From: sommar@enea.se (Erland Sommarskog)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Language tagging
  5. Message-ID: <1993Jan2.231703.21201@enea.se>
  6. Date: 2 Jan 93 23:17:03 GMT
  7. References: <1i2m57INN4vr@rodan.UU.NET> <1993Jan2.020512.3287@klaava.Helsinki.FI> <1321@blue.cis.pitt.edu>
  8. Organization: Enea Data AB
  9. Lines: 40
  10.  
  11. David J Birnbaum (djbpitt+@pitt.edu) writes:
  12. >I think the objections to the input-related problems of Vadim's proposal
  13. >are misdirected, since both Vadim's proposal and Unicode require the
  14. >user to input language identifying information during data entry if this
  15. >information will be needed for later processing. Under Vadim's
  16. >proposal, what would be input would be an instruction (not part of the
  17. >stored text stream) to shift to the appropriate subset of characters.
  18. >Under a system built on a Unicode character set, what would be input
  19. >would be some sort of language or locale tagging that would be entered
  20. >into the text at a higher level than character set.
  21. >
  22. >In both cases, if you want language-specific data in your text stream,
  23. >you have to say so during input. If I need to insert Bulgarian words
  24. >into a Russian text stream I can do so without indicating a change,
  25. >as long as I understand that the consequence will be that the Bulgarian
  26. >data will be treated like Russian.
  27.  
  28. Then I have to ask you explain something about Unicode I don't
  29. know. It is true that if you are using language-dependent features
  30. such as spell-checking and hyphenation, while inputting the text,
  31. then you have to know what you are doing with Unicode. But once
  32. you're done with it, it doesn't matter any longer, until the next 
  33. time you want to process the text in some way. With Unicode you
  34. can decide whether to treat the text in Bulgarian or Russian,
  35. with Vadim's system you're stuck unless you convert it. (Well,
  36. maybe you'll get away with Bulgarian and Russian, but not with
  37. Swedish and German. Or as I demonstrated in another article,
  38. Swedish and Danish.)
  39.  
  40. But of course, if I have CCCP in a Swedish text and copies the word
  41. to a Russian text I will see funny things both with Vadim Antonov's
  42. system and 10646. (And I am sure this confusion will cost someone
  43. a couple of wasted work hours in finding the error.) But at least
  44. shifting scripts is a more obvious, than changing languages. If I 
  45. switch from Swedish to Russian I would probably change the keyboard 
  46. set-up, but not if I switch from Swedish to German - there is no 
  47. reason to.
  48. -- 
  49. Erland Sommarskog - ENEA Data, Stockholm - sommar@enea.se
  50. Jag gav en k{ck tjeck en check.
  51.