home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
PC World Komputer 1998 January
/
Pcwk0198.iso
/
Zadarmo
/
Convert
/
QPL.TXT
< prev
Wrap
Text File
|
1996-01-31
|
4KB
|
93 lines
[QueryPL] by kravietZ 15.01.96
(Mazovia)
Narzædzie do rozpoznawania
standardów polskich znaków
v1.0
QueryPL v1.0 jest programem freeware, rozprowadzanym wraz z kodem
ªródÆowym. SÆuºy do rozpoznawania standardu kodowania polskich znaków
w plikach tekstowych, je₧li standard ten jest nieznany lub niepewny.
:SK£ADNIA:
~~~~~~~~~~
qpl <plik> [-s | -v | -b]
Jako pierwszy argument podaje siæ zawsze plik który ma byì sprawdzony.
Po nazwie pliku mogå nastæpowaì dwa opcjonalne argumenty:
-s uºycie metody statystycznej, generalnie pewniejszej
i koniecznej w niektórych wypadkach; patrz rozdziaÆ
ALGORYTM i UWAGI nr 3.
-v wy₧wietlenie szczegóÆowych informacji o pracy programu,
tabeli zgodno₧ci itp.
-b podanie wyniku analizy w postaci parametru dla
programu ConvPL - cyfry lub litery; opcji tej moºna
uzyì do automatycznego konwertowania plików
o nieznanym standardzie, podstawiajac uzyskany znak
do linii poleceñ CPL jako standard ªródÆowy; patrz
dokumentacja ConvPL; opcja -b automatycznie wyÆåcza
opcjæ -v
:ALGORYTM:
~~~~~~~~~~
Zasada dziaÆania jest nastæpujåca: zliczane så wszystkie wyståpienia
wszystkich polskich znaków narodowych. Poniewaº znaki powtarzajå siæ
w róºnych standardach, kaºde wyståpienie jest zliczane oddzielnie
dla kaºdego ze standardów. Nastæpnie wyståpienia wszystkich znaków
så sumowane w obræbie standardów. Wygrywa standard, w którym zmie₧ciÆo
siæ wiæcej znaków znalezionych w tek₧cie.
Moºe siæ zdarzyì ºe w tek₧cie bædå wystæpowaì znaki nie majåce funkcji
znaków diakrytycznych (np. jako elementy tabelki), ale naleºåce do którego₧
z licznych standardów. W pewnych przypadkach mogå one zmieniì wynik analizy
zwykÆych zliczeñ, prowadzåc do zÆego wyboru standardu. Dla zapobieºenia
temu QPL moºe dodatkowo wykorzystaì wiedzæ o tym, jak czæsto kaºdy z
znaków diakrytycznych wystæpuje w normalnym, polskim tek₧cie. Metodæ
statystycznå, wykorzystujåcå tæ funkcjæ, wÆåcza siæ opcjå -s.
W tym wypadku, przed zsumowaniem zliczeñ kaºde z nich zostanie pomnoºone
przez odpowiedni wspóÆczynnik, wskazujåcy z jakå czæstotliwo₧ciå dana
litera zwykle wystæpuje. Tabelæ zliczeñ znaków dla obu metod wy₧wietla
opcja -v.
Opcji -s naleºy uºywaì do tekstów, w których poza normalnymi polskimi
znakami wystæpujå inne znaki, mogåce byì znakami diakrytycznymi w jakim₧
innym standardzie. Warto siæ teº upewniì, gdy metoda standardowa daje
w wyniku jaki₧ rzadki i niespotykany standard.
:UWAGI:
~~~~~~~
1) Winietka programu i wszystkie informacje så wy₧wietlane na stderr,
dziæki czemu så "niewidzialne" przy zrzucaniu wyj₧cia do pliku,
filtrowaniu itp. Tabela zgodno₧ci (-v) i wynik - parametr dla ConvPL (-b)
så natomiast wy₧wietlane na stdout.
2) QPL jest rozprowadzany razem z konwerterem ConvPL. ZdecydowaÆem siæ
na rozprowadzanie go w postaci odræbnego programu z powodów praktycznych.
Jako taki, moºe on mieì wiæksze moºliwo₧ci, wiæcej zastosowañ i bogatszå
liniæ poleceñ. WspóÆpracæ miædzy obydwoma programami moºna do₧ç Æatwo
zapewniç sobie za pomocå skryptów (U*x) lub baczów (MSDOS/4DOS).
3) Rozróºnienie standardów DHN i Logic jest trudne, bo skÆadajå siæ one
z tych samych znaków, a róºnica miædzy nimi polega na tym, ºe cztery
z nich så zamienione kolejno₧ciå. QPL zazwyczaj trafnie rozpoznaje róºnicæ
przy uºyciu metody statystycznej (-s), jednak w wyniku podaje obie moºliwo₧ci.
Druga z nich jest mniej prawdopodobna, ale zaleºy to od samego tekstu.
Historia:
1.0 pierwsza wersja
..............................................................................
Autor : Pawel Krawczyk <kravietz@pipeta.chemia.pk.edu.pl>
<2:486/18.4@fidonet>
Najnowsza wersja : ftp://pipeta.chemia.pk.edu.pl/pub/convpl/cpl201.zip