index

Začátečník na Internetu
Lekce 11: Internetové servery se službou anonymního FTP


V minulé lekci jsme se soustředili na české servery se službou anonymního FTP a na vyhledávače Nosey ParkerALLA. Dnes si naše znalosti rozšíříme o přehled toho, co nám může nabídnout globálni Internet svými tisíci archivními servery pracujícími na bázi anonymního FTP.

Kde začít? Jak asi tušíte, budeme postupovat standardní cestou. Seznámíme se se základními soubory typu FAQ týkajícími se problematiky anonymního FTP. Ty by nám měly poskytnou aktuální kvalifikované informace z oblasti, o kterou se zajímáme. Samozřejmě, že se nebudeme zajímat o jejich textovou formu, kterou bychom nalezli např. na

ftp://ftp.eunet.cz/pub/news-archive/news.answers/,

ale o jejich hypertextovou formu webového dokumentu. Můžeme ji např. nalézt  na oxfordském WWW serveru www.lib.ox.ac.uk. Základním dokumentem je FAQ s archivním jménem ftp­list/faq, udržovaným Perry Roversem. Dokument nalezneme např. na URL

http://www.lib.ox.ac.uk/internet/news/faq/archive/ftp­list.faq.html

V něm bychom našli vedle nám již známých informacích o FTP i některé pro nás nové poznatky. Předně bychom se dozvěděli, že Perry Rovers udržuje v rámci FAQ i seznam nejdůležitějších serverů anonymního FTP. V současné době je tento seznam tvořen 23 soubory o archivních jménech ftp­list/sitelist/partN (N=1,...23). Tyto soubory nalezneme např. na URL

http://www.lib.ox.ac.uk/internet/news/faq/archive/ftp­list.sitelist.partN.html

Na následujícím obrázku je pro ilustraci znázorněna část dokumentu ftp­list/sitelist/part23 s údaji o serveru vela.acs.oakland.edu.

Poznamenejme, že v mnoha případech údaje uváděné v tomto seznamu jsou zastaralé a neplatné. Rovněž je velmi těžké učinit si představu, kolik "živých" serverů tento seznam obsahuje.

Zajímavou částí dokumentu ftp­list/faq je jeho koncová část obsahující řadu odkazů na dokumenty bezprostředně souvisejících s tématem. Lze v ní nalézt např. dokumenty se seznamy serverů anonymního FTP z některých zemí či teritorií. Obsahuje i odkaz na dokument se slovenskými servery a nefungující odkaz na seznam českých serverů. Velmi užitečnými mohou být odkazy na uváděné vyhledávače dokumentů na serverech s anonymním FTP. V této souvislosti upozorněme na velmi dobrý norský vyhledávač FTPSEARCH,

který najdeme na URL

http://ftpsearch.ntnu.no/ftpsearch

V dokumentu ftp­list/faq si můžeme také přečíst základní informaci o populárním systému ARCHIE.

1. ARCHIE

ARCHIE je systém vyvinutý na montrealské McGillově universitě s cílem vybavit internetovou komunitu prostředkem pro vyhledávání souborů archivovaných na serverech poskytujících službu anonymního FTP. Systém pozůstává ze skupiny klientů a serverů. Servery udržují databáze s informacemi o nejdůležitějších počítačích poskytujících službu anonymního FTP, o jejich adresářích a souborech. V současné době ARCHIE pracuje s cca 1200 takovými počítači. Údaje v databázích jsou pro jednotlivé počítače aktualizovány asi jednou měsíčně. Klienti systému ARCHIE tvoří rozhraní mezi uživatelem, přijímají jeho požadavky na vyhledání, předávají je serverům, které z údajů obsažených v databázích vytvářejí dokument identifikující hledané soubory, cesty k nim a počítače, na kterých jsou archivovány. Výstupní dokument je prostřednictvím klientů prezentován uživateli. Klienti tohoto systému mohou využívat nejrůznější typy rozhraní (telnet, gopher, e­mail). Velmi uživatelsky příjemným je ArchiePlex, který spolupracuje s webovskými prohlížeči jako bránový systém do WWW.

2. ARCHIEPLEX

Seznam serverů typu ArchiePlex je udržován na URL

http://web.nexor.co.uk/archie.html

Mezi nimi jsou tyto populární servery:

ArchiePlex v Nasa: http://www.lerc.nasa.gov/archieplex/doc/form.html

ArchiePlex v Nexoru: http://pubweb.nexor.co.uk/public/archie/archieplex/doc/form.html

ArchiePlex CUI: http://cuiwww.unige.ch/archieplexform.html

ArchiePlex na ZCU v Plzni: http://www.zcu.cz/services/archieplexform.html

Na dalším obrázku máme znázorněn vyplněný vyhledávací formulář serveru ArchiePlex na ZCU (Západočeská univerzita) v Plzni.

Tento druh formuláře je pro servery ArchiePlex typický. Při vyplňování formuláře musíme se v prvé řadě rozhodnout pro typ vyhledávání. Máme k dispozici tyto typy:

- Case Insensitive Substring Match
- Exact Match
- Case Sensitive Substring Match
- Regular Expression Match

V prvých třech případech zadáváme v poli "Search for:" řetězec znaků. Při použití typu Case Insensitive Substring Match je zadaný řetězec chápán jako podřetězec jména souboru nebo názvu adresáře a velikost písmen v zadaném řetězci nemá při porovnávání žádný význam. Tak např. je­li zadán řetězec rfc, tak soubory o jménech RFC1800 nebo rfc1800 vyhovují požadavku. Je­li použit typ Case Sensitive Substring Match, tak velikost písmen je významná. Zadáme­li např. řetězec TeX, tak soubor nebo adresář LaTeX bude požadavku vyhovovat, kdežto soubor o jméně latex nikoliv. Při volbě Exact Match musí být jméno souboru nebo označení adresáře totožné se zadaným řetězcem, a to nejen co do velikosti písmen, ale i co do délky. Při použití typu vyhledávání Regular Expression Match zadáváme v poli "Search for:" regulární výraz ve smyslu unixového programu ed.

V poli "Several Archie Servers can be used" nabízí se uživateli seznam serverů systému ARCHIE, z kterého si má zvolit ten server, jehož databáze bude při plnění požadavku použita. U serveru ArchiePlex ZCU jsou na jeho seznamu např. tyto servery:

Austria (University of Vienna)
Canada (McGill University)
Switzerland (SWITCH)
United Kingdom (HENSA)
United Kingdom (IC LONDON)
USA­MD (SURAnet)
USA­NJ (Internic)
USA­NJ (Rutgers University)
USA­NY (ANS) a pod.

Přepínače The results can be sorted umožňují zvolit třídění výsledků buď podle doménových jmen počítačů nebo dle data. Lze také prohledávání omezit na uživatelem definovanou doménu či nastavit maximální délku výstupu.

V minulé lekci jsme pomoci Nosey Parkera hledali program ws_ftple.exe. Zkusme, jaké výsledky dostaneme prostřednictvím plzeňského serveru pro řetěz ws_ftple.exe s vyhledávacím typem Case Insensitive Substring Match, s použitím serveru Archie United Kingdom (IC London) a s omezenim výsledků na doménu ca (viz předchozí obrázek). Podívejme se na výsledek:

Hledaný program je v Kanadě na dvou serverech anonymního FTP. Nejčerstvější kopie je z konce letošního ledna, druhá ze září minulého roku.

V rámci úplnosti nám zbývá probrat alespoň ilustrativně, jaké možnosti máme při použití regulární výrazů a zda pro náše Windows 95 existuje nějaký šikovný ARCHIE klient. To bude obsahem výkladu naší další lekce.