home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / lang / rexx / 1497 < prev    next >
Encoding:
Text File  |  1993-01-21  |  2.1 KB  |  47 lines

  1. Newsgroups: comp.lang.rexx
  2. Path: sparky!uunet!mcsun!sunic!fuw.edu.pl!cocos!jt
  3. From: jt@fuw.edu.pl (Jerzy Tarasiuk)
  4. Subject: Re: Lower-case alphabetic set
  5. In-Reply-To: Jack Hamilton's message of Thu, 7 Jan 1993 13:05:37 PST
  6. Message-ID: <JT.93Jan21152802@fizyk1.fuw.edu.pl>
  7. Sender: news@fuw.edu.pl
  8. Nntp-Posting-Host: fizyk1
  9. Organization: Warsaw University Physics Dept.
  10. References: <9301072105.AA26425@netcom.netcom.com>
  11. Date: Thu, 21 Jan 1993 14:28:02 GMT
  12. Lines: 33
  13.  
  14. >>>>> On Thu, 7 Jan 1993 13:05:37 PST, Jack Hamilton <jfh@NETCOM.NETCOM.COM> said:
  15. Jack> Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  16. Jack> Comments: To: REXXLIST@OHSTVMA.ACS.OHIO-STATE.EDU
  17.  
  18. Jack> Jim McMaster wrote:
  19. >
  20. >Your technique would work in an ASCII system, bacause all upper-case
  21. >alphabetics are in the range X'41'-X'5A' (with no intermixed
  22. >characters), and lower-case alphabetics are X'61'-X'7A'.
  23.  
  24. Jack> Only for business English.  I don't think it would be true for poetic
  25. Jack> English, which uses some special accented characters (double-dot over the O
  26. Jack> in coordinate, backward slash over the last e in despised), and it's not
  27. Jack> true for many European languages with accented characters as part of the
  28. Jack> regular character set.
  29.  
  30. Jack> Is there a generic name for those character sets, other than "8-bit"?
  31.  
  32. Fact, translate cannot be used for Double Byte Character Set (or what
  33. is its name). Need detect character set escape character and maintain
  34. it separately. The simple expression containing two translate() and
  35. two xrange('a','z') should be limited to strings which doesn't contain
  36. double byte characters. For best speed use:
  37.     parse var inp tmp 'code'x inp
  38. to detect c.s. escape (I don't know what code it has); then translate
  39. tmp: out=out''translate(tmp,xrange('a','z'),translate(xrange('a','z')))
  40. then use parse to split inp to one char and remaining string, translate
  41. the one char (what are rules of converting case of it?) and add it
  42. (preceded by the escape code) to out. Until all inp chars processed.
  43. Note is last char in input string is the escape code parse doesn't give
  44. any information: must check length(inp) and count characters used...
  45.  
  46. Jerzy Tarasiuk <jt@zfja-gate.fuw.edu.pl>
  47.