home *** CD-ROM | disk | FTP | other *** search
- [QueryPL] by kravietZ 15.01.96
- (Mazovia)
-
-
-
- Narzædzie do rozpoznawania
- standardów polskich znaków
- v1.0
-
-
-
- QueryPL v1.0 jest programem freeware, rozprowadzanym wraz z kodem
- ªródÆowym. SÆuºy do rozpoznawania standardu kodowania polskich znaków
- w plikach tekstowych, je₧li standard ten jest nieznany lub niepewny.
-
- :SK£ADNIA:
- ~~~~~~~~~~
-
- qpl <plik> [-s | -v | -b]
-
- Jako pierwszy argument podaje siæ zawsze plik który ma byì sprawdzony.
- Po nazwie pliku mogå nastæpowaì dwa opcjonalne argumenty:
-
- -s uºycie metody statystycznej, generalnie pewniejszej
- i koniecznej w niektórych wypadkach; patrz rozdziaÆ
- ALGORYTM i UWAGI nr 3.
-
- -v wy₧wietlenie szczegóÆowych informacji o pracy programu,
- tabeli zgodno₧ci itp.
-
- -b podanie wyniku analizy w postaci parametru dla
- programu ConvPL - cyfry lub litery; opcji tej moºna
- uzyì do automatycznego konwertowania plików
- o nieznanym standardzie, podstawiajac uzyskany znak
- do linii poleceñ CPL jako standard ªródÆowy; patrz
- dokumentacja ConvPL; opcja -b automatycznie wyÆåcza
- opcjæ -v
-
- :ALGORYTM:
- ~~~~~~~~~~
- Zasada dziaÆania jest nastæpujåca: zliczane så wszystkie wyståpienia
- wszystkich polskich znaków narodowych. Poniewaº znaki powtarzajå siæ
- w róºnych standardach, kaºde wyståpienie jest zliczane oddzielnie
- dla kaºdego ze standardów. Nastæpnie wyståpienia wszystkich znaków
- så sumowane w obræbie standardów. Wygrywa standard, w którym zmie₧ciÆo
- siæ wiæcej znaków znalezionych w tek₧cie.
-
- Moºe siæ zdarzyì ºe w tek₧cie bædå wystæpowaì znaki nie majåce funkcji
- znaków diakrytycznych (np. jako elementy tabelki), ale naleºåce do którego₧
- z licznych standardów. W pewnych przypadkach mogå one zmieniì wynik analizy
- zwykÆych zliczeñ, prowadzåc do zÆego wyboru standardu. Dla zapobieºenia
- temu QPL moºe dodatkowo wykorzystaì wiedzæ o tym, jak czæsto kaºdy z
- znaków diakrytycznych wystæpuje w normalnym, polskim tek₧cie. Metodæ
- statystycznå, wykorzystujåcå tæ funkcjæ, wÆåcza siæ opcjå -s.
-
- W tym wypadku, przed zsumowaniem zliczeñ kaºde z nich zostanie pomnoºone
- przez odpowiedni wspóÆczynnik, wskazujåcy z jakå czæstotliwo₧ciå dana
- litera zwykle wystæpuje. Tabelæ zliczeñ znaków dla obu metod wy₧wietla
- opcja -v.
-
- Opcji -s naleºy uºywaì do tekstów, w których poza normalnymi polskimi
- znakami wystæpujå inne znaki, mogåce byì znakami diakrytycznymi w jakim₧
- innym standardzie. Warto siæ teº upewniì, gdy metoda standardowa daje
- w wyniku jaki₧ rzadki i niespotykany standard.
-
- :UWAGI:
- ~~~~~~~
- 1) Winietka programu i wszystkie informacje så wy₧wietlane na stderr,
- dziæki czemu så "niewidzialne" przy zrzucaniu wyj₧cia do pliku,
- filtrowaniu itp. Tabela zgodno₧ci (-v) i wynik - parametr dla ConvPL (-b)
- så natomiast wy₧wietlane na stdout.
-
- 2) QPL jest rozprowadzany razem z konwerterem ConvPL. ZdecydowaÆem siæ
- na rozprowadzanie go w postaci odræbnego programu z powodów praktycznych.
- Jako taki, moºe on mieì wiæksze moºliwo₧ci, wiæcej zastosowañ i bogatszå
- liniæ poleceñ. WspóÆpracæ miædzy obydwoma programami moºna do₧ç Æatwo
- zapewniç sobie za pomocå skryptów (U*x) lub baczów (MSDOS/4DOS).
-
- 3) Rozróºnienie standardów DHN i Logic jest trudne, bo skÆadajå siæ one
- z tych samych znaków, a róºnica miædzy nimi polega na tym, ºe cztery
- z nich så zamienione kolejno₧ciå. QPL zazwyczaj trafnie rozpoznaje róºnicæ
- przy uºyciu metody statystycznej (-s), jednak w wyniku podaje obie moºliwo₧ci.
- Druga z nich jest mniej prawdopodobna, ale zaleºy to od samego tekstu.
-
- Historia:
- 1.0 pierwsza wersja
-
- ..............................................................................
- Autor : Pawel Krawczyk <kravietz@pipeta.chemia.pk.edu.pl>
- <2:486/18.4@fidonet>
- Najnowsza wersja : ftp://pipeta.chemia.pk.edu.pl/pub/convpl/cpl201.zip
-
-