home *** CD-ROM | disk | FTP | other *** search
- Xref: sparky fnet.general:207 resif.info.divers:84
- Newsgroups: fnet.general,resif.info.divers
- Path: sparky!uunet!elroy.jpl.nasa.gov!univ-lyon1.fr!ensta!julienas!babbage!cosmos.imag.fr!berger
- From: berger@imag.fr (Gilles BERGER SABBATEL)
- Subject: Re: News 8-bits (Re: Une hierarchie de news...)
- Message-ID: <berger.725043164@gram>
- Sender: news@imag.fr
- Nntp-Posting-Host: gram.imag.fr
- Organization: Institut Imag, Grenoble, France
- References: <berger.724947541@gram> <BznptA.B6@imag.fr> <1h7125INNknn@grasp1.univ-lyon1.fr>
- Date: Tue, 22 Dec 1992 16:52:44 GMT
- Lines: 96
-
- Christophe.Wolfhugel@grasp.insa-lyon.fr (Christophe Wolfhugel) writes:
-
- >LOGICIELS de TRANSPORT
-
- >Le point principal semble etre que les caracteres 8 bits ne sont pas
- >supportes dans les entetes. Dur dur de demander a un utilisateur
- >de taper des accents dans le corps du message mais pas dans le champ
- >Subject ! Un RFC definit un encodage de ces caracteres pour les
- >entetes.
-
- Le logiciel de postage peut toujours filtrer ou convertir les caracteres
- 8 bits. Sur une des machines que j'ai essayee, je n'ai d'ailleurs pas
- pu rentrer de caracteres accentues dans l'en-tete, alors que ca marchait
- dans le corps.
-
- >Les transporteurs supplementaires de type nntp-1.5.11 ou UUCP supportent-ils
- >aussi les 8-bits (INN fournit son propre transporteur NNTP). Et jusqu'a
- >quel niveau (entete ou pas).
-
- Pas de Pb avec nntp-1.5.11, puisque c'est ce que j'ai utilise' au cours
- de mes essais, donc, ca marche. Quand a UUCP, je ne sais plus trop ce
- que c'est, Dieu merci :-). Dans mes lointains souvenirs, c'est un truc
- qui marche sur des lignes series sensees transporter 7 bits, et si on
- veut transmettre autre chose que de l'ascci, il faut coder ca en
- caracteres 7 bits...
-
- >Transporter par exemple le jeu ISO-8859-1 (LATIN1) qui permet de
- >representer quasiment (sinon) toutes les langues utilisant cet
- >alphabet, y compris les langues d'Europe de l'Est et scnadinaves.
-
- Ca presente deja l'avantage d'avoir une bonne base de machines qui
- fonctionnent directement avec. Ca presente peut etre l'inconvenient
- de demobiliser ceux qui ont de telles machines, puisque ca marche pour
- eux! :-)
-
- >Il reste a trouver un mecanisme faisant une conversion en 7-bits
- >pour les sites non equipes (solution MIME ou le choix X-Char-Esc
- >de Keld Simonsen). Cela demande de modifier les transporteurs
- >(nntpxmit, innxmit, nntplink et dans l'autre sens nntpd, innd) et
- >il faudra rajouter des pre et post-processeurs a rnews.
-
- Si je me souviens bien, pour les C-News, l'envoi en mode batche passe
- par l'intermediaire d'un script shell. Il suffit de modifier ces
- scripts pour installer un filtre de conversion lors de l'envoi vers des
- sites reputes non 8 bits.
-
- Cette conversion peut soit filtrer les caracteres 8 bits en les
- remplacant par le caractere non accentue correspondant, soit les
- remplacer par un codage du type caractere-accent, soit enfin les
- remplacer par un codage du type accent-backspace-caractere. Ce dernier
- codage (si l'utilisation de backspaces ne pose pas de problemes)
- permettrait aux textes d'etre directement lisibles sur n'importe quel
- peripherique - sans accent le plus souvent - et surtout d'etre
- reversible.
-
- >Peut-etre aussi une extension au protocole NNTP permettant au site
- >appele d'indique s'il supporte ou non le jeu LATIN1.
-
- Ce n'est pas forcement necessaire de determiner cela dynamiquement. On
- peut avoir une table indiquant que le site X accepte le 8 bits, table
- consultee par le script d'envoi. On peut aussi "cabler" cela dans le
- script d'envoi : les sites connectes ne changent pas si souvent!
-
- >INTERFACES UTILISATEUR
-
- >Si maintenant la partie transport a ete reglee et les articles
- >transportes sont en code LATIN1 (sur ensemble du jeu ASCII, donc
- >pas de problemes pour les articles en provenance des US) il faut
- >que les outils de lecture s'adaptent et proposent eventuellement
- >conversion du jeu ISO vers le jeu de la machine de l'utilisateur.
-
- A ce niveau, il faut recenser les problemes (logiciel, systeme, jeu de
- caracteres), et que chaque probleme soit pris en charge par la personne
- qui se sent le plus concernee ou motivee... Pour cela, il va falloir
- essayer... De toutes facons, il faudra commencer par rediger une baterie
- de tables de conversion ISO-n'importe quoi, utilisables dans differents
- logiciels. Je veux bien contribuer a cela.
-
- >Dernier point: et toutes les langues ne pouvant etre transportees par
- >l'ISO-8859-1 (s'il y a) ?
-
- Oui, le japonais. Ils ont une facon particuliere de coder leurs
- caracteres sur deux octets (quatre alphabets : l'alphabet latin, dit
- "romaji", les deux syllabaires katakana et hiragana (56 caracteres
- chacuns), et les Kanji, autrement dit ideogrammes chinois). Je ne
- sais pas exactement comment ca se passe, ni comment ca peut interagir
- avec notre probleme.
-
- Si on doit se lancer dans ce genre de travail, il y aura sans doute pas
- mal d'echanges techniques sur le sujet, echanges qui risquent de vite
- lasser le lecteur moyen des news. Pourquoi ne pas envisager la creation
- d'un newsgroup fnet.8bits?
- --
- Gilles BERGER SABBATEL Tel: (33) 76 57 46 13
- Laboratoire d'appartenance : TIM3
- IMAG-LGI/INPG, 46 Avenue Felix Viallet, 38031 GRENOBLE CEDEX - FRANCE
-