WinHTTrack 3.23

WinHTTrack Website Copier je off-line browser, který lze používat zdarma (Open Source). Program dokáže stáhnout požadovaný web (HTML soubory, styly, skripty, obrázky atd.) a vytvořit na disku funkční kopii pro off-line prohlížení. K dispozici je též funkce „update“ pro aktualizaci existující off-line kopie webu a funkce „obnovení přerušeného stahování“.

Instalovat

Kopírovat

http://www.httrack.com

typ softwaru  freeware  |   operační systém  Win9x/ME,NT,2000,XP  |   objem dat  3,0 MB  |   jazyk  česky  |    zdarma

Program umí také česky a slovensky. Změnu jazyka lze provést ihned po prvním spuštění programu (objeví se příslušná nabídka) nebo kdykoliv později příkazem Preferences/Language preference. V tomto článku budu uvádět anglické i české názvy nabídek a příkazů.

Rychle a snadno

Chceme-li vytvořit kopii menšího jednoduchého webu, lze to učinit snadno a bez pracného nastavování. Celý proces probíhá formou průvodce, jehož úvodní okno je vidět ihned po spuštění programu. Stačí kliknout na tlačítko Next (Další) a dostáváme se k prvnímu bodu.

1. Zadejte název nového projektu (položka Project name, Název projektu) nebo vyberte už existující projekt, který chcete aktualizovat nebo „dodělat“ (např. pokud došlo k přerušení stahování). Také můžete změnit složku pro ukládání projektů (položka Base path, Základní cesta).

2. Během druhého kroku musíte v první řadě vybrat typ akce (položka Action, Akce). Nabízí se sedm možností (popis některých možností viz tabulka 1), z nichž nejčastěji využijete hned tu první – Download web site (Stažení web stránek).

Poté do pole Web Addresses (Adresy WWW) zapište požadovanou adresu webu (adresy webů), který chcete stáhnout. Při přidávání adres můžete také využít tlačítko Add URL (Přidat URL). Toto tlačítko se hodí především tehdy, potřebujete-li definovat dodatečné parametry (vstupní jméno a heslo požadované pro vstup na určitou stránku) nebo chcete-li zachytit složitější URL (užitečné např. u stránky, která se objeví až po odeslání formuláře).


Obr. 1. Průběh stahování

Nakonec můžete využít tlačítko Set options (Nastavení) – pak budete moci změnit celou řadu parametrů. Různá nastavení si popíšeme dále; nyní zkuste nic neměnit (u jednoduchých a malých webů nebo při stahování pouze určitých menších částí webu to většinou ani není potřeba) a pokračujte dále.

3. Dostáváme se k poslednímu kroku průvodce. V části Remote connect (Spojení s poskytovatelem) můžete vybrat požadované připojení a případně využít volbu Disconnect when finished (Odpojit po dokončení). Hodit se může i volba On hold (Podržet), díky které můžete nastavit dobu, kdy začne stahování. Chcete-li nastavení právě definovaného projektu pouze uložit a stahovat až později, zvolte poslední volbu – Save settings only, do not launch download now (Pouze uložit nastavení, nezahájit stahování).

Nakonec klikněte na tlačítko Dokončit. Poté začne stahování, jehož průběh máte možnost vidět, a to včetně užitečných informací (viz obr. 1).

4. Jakmile stahování skončí, budete moci využít dvou tlačítek – View error log (Zobrazit chybový protokol) a Browse Mirrored Website (Prohlédnout stažené stránky).

Download web site(s);
Stažení web stránek
Vytvoří kopii požadovaného webu (nebo i více webů).
Download all sites in pages (multiple mirror); Stažení všech stránek (vícenásobné stažení) Stáhnou se všechny weby, jejichž odkazy se objeví na zadané stránce (stránkách). Pokud do políčka Web Addresses (Adresy WWW) přetáhnete (drag and drop) svůj soubor s oblíbenými odkazy (bookmark file), dojde ke stažení všech vašich oblíbených webů.
Test links in pages (bookmark test);
Kontrola odkazů na stránkách (test záložek)
Otestuje se funkčnost (existence) všech odkazů na zadané stránce (stránkách). Vhodné např. pro kontrolu stránky s oblíbenými odkazy (bookmark file).
Continue interrupted download;
Navázání přerušeného stahování
Pokračování přerušeného stahování (ať už přerušení způsobil uživatel, výpadek spojení nebo jiný problém).
Update existing download;
Aktualizace stažených stránek
Aktualizace už exitujícího projektu – zkontroluje se struktura webu a každý stažený soubor.

Tabulka 1. Na výběr máte několik akcí, z nichž nejčastěji využijete hned tu první – „Download web site(s)“.


Filtry – mocný nástroj

V předchozí části jsme se během druhého kroku dostali k tlačítku Set options (Nastavení), které vám umožní provést celou řadu detailních nastavení. Začneme filtry.
Filtry jsou velmi užitečnou funkcí programu. V okně Options (Nastavení) je najdete na záložce Scan Rules (Filtry). Uvedeme si malý příklad, ze kterého snadno pochopíte, jak WinHTTrack funguje a k čemu jsou filtry dobré.

Předpokládejme, že zadáte v programu tuto adresu: www.zviratka.cz/info/kocky. WinHTTrack pak stáhne vše, co se na této adrese nachází, a to včetně podsložek (jako např. www.zviratka.cz/info/kocky/perske). Nebudou se však stahovat soubory, které jsou na jiných webech, a také soubory, jež se nacházejí ve výše umístěných složkách (např. www.zviratka.cz/info). To je základní vlastnost programu, která má zajistit, aby se nestahovalo příliš mnoho dat. Pokud budete chtít tuto základní vlastnost pozměnit, budete muset použít filtry.
Představme si, že vás ještě zajímá adresa www.zviratka.cz/info/psi a adresa www.zviratka.cz/fotografie, a naopak stahovat nechcete adresu www.zviratka.cz/info/kocky/domaci. V tom případě stačí na záložce Scan Rules (Filtry) přidat tyto tři filtry:

+ www.zviratka.cz/info/psi/*
+ www.zviratka.cz/fotografie/*
– www.zviratka.cz/info/kocky/domaci/*

Znaménko plus říká: „Navíc stahuj také toto…“ a znaménko minus říká: „Při stahování vynech toto…“. Znak hvězdička zastupuje všechny znaky.
V našem (výše uvedeném) příkladě dosáhneme tedy toho, že se stáhnou data na adrese www.zviratka.cz/info/kocky, vynechají se ale data na adrese www.zviratka.cz/info/kocky/domaci, a navíc se stáhnou data z adresy www.zviratka.cz/info/psi a data z adresy www.zviratka.cz/fotografie.

Další možnosti filtrů

Jakmile se poprvé dostanete na záložku Scan Rules (Filtry), najdete tam zadané tyto filtry:
+*.png +*.gif +*.jpg +*.css +*.js
Díky tomu vám na stažených stránkách nebudou chybět obrázky, styly a javaskriptové kódy. Vraťme se k předchozímu příkladu. Chcete stáhnout adresu www.zviratka.cz/info/kocky. Obrázky se ale mohou nacházet na adrese www.zviratka.cz/obrazky, styly na adrese www.zviratka.cz/styly a javaskriptové kódy na adrese www.zviratka.cz/skripty. Výše uvedený filtr tedy zajistí, že nám na stažených stránkách nebudou chybět obrázky, styly a skripty.


Obr. 2. Filtry jsou mocný nástroj. Pokud použijete např. filtr –*.zip, nebudou se stahovat žádné soubory s příponou ZIP.

Jednotlivé definice filtrů můžete psát na jeden řádek a oddělovat je mezerou nebo lze psát každý filtr na nový řádek.
Možnosti filtrů jsou rozsáhlé a nelze zde popsat všechno. Kompletní popis filtrů najdete v nápovědě programu (je anglická). Při sestavování filtrů vám také mohou pomoci tlačítka Exclude links (Vyloučit odkazy) a Include links (Zahrnout odkazy).

Nastavte si omezení

Další užitečné funkce, které se mohou hodit, najdete na záložce Limits (Limitní hodnoty). Zde lze definovat různá omezení, která mají především za cíl zamezit stahování velkého objemu dat. Nevhodným nastavením však můžete naopak způsobit stahování extrémních objemů. Proto si jakékoliv změny na této záložce důkladně promyslete – postačující je většinou definovat své požadavky pomocí filtrů. Přesto si však několik funkcí popíšeme:

Struktura staženého webu

Poslední funkcí, kterou si popíšeme, je možnost definovat strukturu staženého webu – najděte si záložku Build (Struktura). Zde můžete hned v prvním poli vybrat způsob, jak budou na disku uložena všechna data. Výchozím nastavením je Site structure (Struktura stránky) – struktura kopie (rozložení a názvy složek a souborů) bude stejná jako originál (tj. jako stahovaný web). Můžete však zvolit i jiný způsob (např. všechny HTML soubory se budou ukládat do složky HTML, všechny obrázky do složky IMAGES apod.). Další detailní nastavení lze provést po kliknutí na tlačítko Options (Nastavení).

Norbert Gulevič