home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / comp / std / internat / 954 < prev    next >
Encoding:
Text File  |  1992-12-31  |  1.3 KB  |  35 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!think.com!paperboy.osf.org!down.osf.org!lehotsky
  3. From: lehotsky@down.osf.org (Alan Lehotsky)
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <1992Dec31.165126.22124@osf.org>
  6. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  7. Sender: news@osf.org (USENET News System)
  8. Organization: Open Software Foundation
  9. References: <8490@charon.cwi.nl> <1992Dec31.110735.17551@infodev.cam.ac.uk> <C04py2.8C5@world.std.com>
  10. Date: Thu, 31 Dec 1992 16:51:26 GMT
  11. Lines: 22
  12.  
  13.  
  14. Regarding Peter's observation that dumb software incorrectly expands
  15. "St. Botolph St." as "Saint Botolph Saint", I should point out that
  16. the earlier drafts of POSIX.2 addressed this problem by supporting a
  17. syntax in the LC_COLLATE category for context-sensitive symbol
  18. substitution.  This appears to have been withdrawn from the final
  19. drafts (perhaps due to a belief that it was not arbitrarily powerful).
  20.  
  21. Still, in OSF/1, we implemented the 'substitute' construct.  This
  22. permits BRE's in the string expressions so that you can say something
  23. like:
  24.  
  25.     substitute "\(.*\)St\.$" with "\1Street"
  26.  
  27.     substutute "St\([e]\)\. \(.*\)" with "Saint\1 \2"
  28.  
  29. and (if I haven't made some stupid mistake with the syntax) get
  30. strcoll() to do the right things.  [The second case even handles
  31. female saints correctly!]
  32.  
  33. -- Al Lehotsky
  34.  
  35.