home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #31 / NN_1992_31.iso / spool / fnet / general / 207 < prev    next >
Encoding:
Internet Message Format  |  1992-12-22  |  5.1 KB

  1. Xref: sparky fnet.general:207 resif.info.divers:84
  2. Newsgroups: fnet.general,resif.info.divers
  3. Path: sparky!uunet!elroy.jpl.nasa.gov!univ-lyon1.fr!ensta!julienas!babbage!cosmos.imag.fr!berger
  4. From: berger@imag.fr (Gilles BERGER SABBATEL)
  5. Subject: Re: News 8-bits (Re: Une hierarchie de news...)
  6. Message-ID: <berger.725043164@gram>
  7. Sender: news@imag.fr
  8. Nntp-Posting-Host: gram.imag.fr
  9. Organization: Institut Imag, Grenoble, France
  10. References: <berger.724947541@gram> <BznptA.B6@imag.fr> <1h7125INNknn@grasp1.univ-lyon1.fr>
  11. Date: Tue, 22 Dec 1992 16:52:44 GMT
  12. Lines: 96
  13.  
  14. Christophe.Wolfhugel@grasp.insa-lyon.fr (Christophe Wolfhugel) writes:
  15.  
  16. >LOGICIELS de TRANSPORT
  17.  
  18. >Le point principal semble etre que les caracteres 8 bits ne sont pas
  19. >supportes dans les entetes.  Dur dur de demander a un utilisateur
  20. >de taper des accents dans le corps du message mais pas dans le champ
  21. >Subject !   Un RFC definit un encodage de ces caracteres pour les
  22. >entetes.
  23.  
  24. Le logiciel de postage peut toujours filtrer ou convertir les caracteres
  25. 8 bits.  Sur une des machines que j'ai essayee, je n'ai d'ailleurs pas
  26. pu rentrer de caracteres accentues dans l'en-tete, alors que ca marchait
  27. dans le corps.
  28.  
  29. >Les transporteurs supplementaires de type nntp-1.5.11 ou UUCP supportent-ils
  30. >aussi les 8-bits (INN fournit son propre transporteur NNTP). Et jusqu'a
  31. >quel niveau (entete ou pas).
  32.  
  33. Pas de Pb avec nntp-1.5.11, puisque c'est ce que j'ai utilise' au cours
  34. de mes essais, donc, ca marche.  Quand a UUCP, je ne sais plus trop ce
  35. que c'est, Dieu merci :-).  Dans mes lointains souvenirs, c'est un truc
  36. qui marche sur des lignes series sensees transporter 7 bits, et si on
  37. veut transmettre autre chose que de l'ascci, il faut coder ca en
  38. caracteres 7 bits...
  39.  
  40. >Transporter par exemple le jeu ISO-8859-1 (LATIN1) qui permet de
  41. >representer quasiment (sinon) toutes les langues utilisant cet
  42. >alphabet, y compris les langues d'Europe de l'Est et scnadinaves.
  43.  
  44. Ca presente deja l'avantage d'avoir une bonne base de machines qui
  45. fonctionnent directement avec.  Ca presente peut etre l'inconvenient
  46. de demobiliser ceux qui ont de telles machines, puisque ca marche pour
  47. eux! :-)
  48.  
  49. >Il reste a trouver un mecanisme faisant une conversion en 7-bits
  50. >pour les sites non equipes (solution MIME ou le choix X-Char-Esc
  51. >de Keld Simonsen).  Cela demande de modifier les transporteurs
  52. >(nntpxmit, innxmit, nntplink et dans l'autre sens nntpd, innd) et
  53. >il faudra rajouter des pre et post-processeurs a rnews.
  54.  
  55. Si je me souviens bien, pour les C-News, l'envoi en mode batche passe
  56. par l'intermediaire d'un script shell.  Il suffit de modifier ces
  57. scripts pour installer un filtre de conversion lors de l'envoi vers des
  58. sites reputes non 8 bits.
  59.  
  60. Cette conversion peut soit filtrer les caracteres 8 bits en les
  61. remplacant par le caractere non accentue correspondant, soit les
  62. remplacer par un codage du type caractere-accent, soit enfin les
  63. remplacer par un codage du type accent-backspace-caractere.  Ce dernier
  64. codage (si l'utilisation de backspaces ne pose pas de problemes)
  65. permettrait aux textes d'etre directement lisibles sur n'importe quel
  66. peripherique - sans accent le plus souvent - et surtout d'etre
  67. reversible.
  68.  
  69. >Peut-etre aussi une extension au protocole NNTP permettant au site
  70. >appele d'indique s'il supporte ou non le jeu LATIN1.
  71.  
  72. Ce n'est pas forcement necessaire de determiner cela dynamiquement.  On
  73. peut avoir une table indiquant que le site X accepte le 8 bits, table
  74. consultee par le script d'envoi.  On peut aussi "cabler" cela dans le
  75. script d'envoi : les sites connectes ne changent pas si souvent!
  76.  
  77. >INTERFACES UTILISATEUR
  78.  
  79. >Si maintenant la partie transport a ete reglee et les articles
  80. >transportes sont en code LATIN1 (sur ensemble du jeu ASCII, donc
  81. >pas de problemes pour les articles en provenance des US) il faut
  82. >que les outils de lecture s'adaptent et proposent eventuellement
  83. >conversion du jeu ISO vers le jeu de la machine de l'utilisateur.
  84.  
  85. A ce niveau, il faut recenser les problemes (logiciel, systeme, jeu de
  86. caracteres), et que chaque probleme soit pris en charge par la personne
  87. qui se sent le plus concernee ou motivee...  Pour cela, il va falloir
  88. essayer...  De toutes facons, il faudra commencer par rediger une baterie
  89. de tables de conversion ISO-n'importe quoi, utilisables dans differents
  90. logiciels.  Je veux bien contribuer a cela.
  91.  
  92. >Dernier point: et toutes les langues ne pouvant etre transportees par
  93. >l'ISO-8859-1 (s'il y a) ?
  94.  
  95. Oui, le japonais.  Ils ont une facon particuliere de coder leurs
  96. caracteres sur deux octets (quatre alphabets : l'alphabet latin, dit
  97. "romaji", les deux syllabaires katakana et hiragana (56 caracteres
  98. chacuns), et les Kanji, autrement dit ideogrammes chinois).  Je ne
  99. sais pas exactement comment ca se passe, ni comment ca peut interagir
  100. avec notre probleme.
  101.  
  102. Si on doit se lancer dans ce genre de travail, il y aura sans doute pas
  103. mal d'echanges techniques sur le sujet, echanges qui risquent de vite
  104. lasser le lecteur moyen des news.  Pourquoi ne pas envisager la creation
  105. d'un newsgroup fnet.8bits?
  106. --
  107. Gilles BERGER SABBATEL                  Tel: (33) 76 57 46 13
  108. Laboratoire d'appartenance : TIM3
  109. IMAG-LGI/INPG, 46 Avenue Felix Viallet, 38031 GRENOBLE CEDEX - FRANCE
  110.