[QueryPL] by kravietZ 15.01.96 (Mazovia) Narz‘dzie do rozpoznawania standard˘w polskich znak˘w v1.0 QueryPL v1.0 jest programem freeware, rozprowadzanym wraz z kodem ¦r˘d’owym. S’u§y do rozpoznawania standardu kodowania polskich znak˘w w plikach tekstowych, ježli standard ten jest nieznany lub niepewny. :SKśADNIA: ~~~~~~~~~~ qpl [-s | -v | -b] Jako pierwszy argument podaje si‘ zawsze plik kt˘ry ma byŤ sprawdzony. Po nazwie pliku mog† nast‘powaŤ dwa opcjonalne argumenty: -s u§ycie metody statystycznej, generalnie pewniejszej i koniecznej w niekt˘rych wypadkach; patrz rozdzia’ ALGORYTM i UWAGI nr 3. -v wyžwietlenie szczeg˘’owych informacji o pracy programu, tabeli zgodnožci itp. -b podanie wyniku analizy w postaci parametru dla programu ConvPL - cyfry lub litery; opcji tej mo§na uzyŤ do automatycznego konwertowania plik˘w o nieznanym standardzie, podstawiajac uzyskany znak do linii polece¤ CPL jako standard ¦r˘d’owy; patrz dokumentacja ConvPL; opcja -b automatycznie wy’†cza opcj‘ -v :ALGORYTM: ~~~~~~~~~~ Zasada dzia’ania jest nast‘puj†ca: zliczane s† wszystkie wyst†pienia wszystkich polskich znak˘w narodowych. Poniewa§ znaki powtarzaj† si‘ w r˘§nych standardach, ka§de wyst†pienie jest zliczane oddzielnie dla ka§dego ze standard˘w. Nast‘pnie wyst†pienia wszystkich znak˘w s† sumowane w obr‘bie standard˘w. Wygrywa standard, w kt˘rym zmiežci’o si‘ wi‘cej znak˘w znalezionych w tekžcie. Mo§e si‘ zdarzyŤ §e w tekžcie b‘d† wyst‘powaŤ znaki nie maj†ce funkcji znak˘w diakrytycznych (np. jako elementy tabelki), ale nale§†ce do kt˘regož z licznych standard˘w. W pewnych przypadkach mog† one zmieniŤ wynik analizy zwyk’ych zlicze¤, prowadz†c do z’ego wyboru standardu. Dla zapobie§enia temu QPL mo§e dodatkowo wykorzystaŤ wiedz‘ o tym, jak cz‘sto ka§dy z znak˘w diakrytycznych wyst‘puje w normalnym, polskim tekžcie. Metod‘ statystyczn†, wykorzystuj†c† t‘ funkcj‘, w’†cza si‘ opcj† -s. W tym wypadku, przed zsumowaniem zlicze¤ ka§de z nich zostanie pomno§one przez odpowiedni wsp˘’czynnik, wskazuj†cy z jak† cz‘stotliwožci† dana litera zwykle wyst‘puje. Tabel‘ zlicze¤ znak˘w dla obu metod wyžwietla opcja -v. Opcji -s nale§y u§ywaŤ do tekst˘w, w kt˘rych poza normalnymi polskimi znakami wyst‘puj† inne znaki, mog†ce byŤ znakami diakrytycznymi w jakimž innym standardzie. Warto si‘ te§ upewniŤ, gdy metoda standardowa daje w wyniku jakiž rzadki i niespotykany standard. :UWAGI: ~~~~~~~ 1) Winietka programu i wszystkie informacje s† wyžwietlane na stderr, dzi‘ki czemu s† "niewidzialne" przy zrzucaniu wyjžcia do pliku, filtrowaniu itp. Tabela zgodnožci (-v) i wynik - parametr dla ConvPL (-b) s† natomiast wyžwietlane na stdout. 2) QPL jest rozprowadzany razem z konwerterem ConvPL. Zdecydowa’em si‘ na rozprowadzanie go w postaci odr‘bnego programu z powod˘w praktycznych. Jako taki, mo§e on mieŤ wi‘ksze mo§liwožci, wi‘cej zastosowa¤ i bogatsz† lini‘ polece¤. Wsp˘’prac‘ mi‘dzy obydwoma programami mo§na dož‡ ’atwo zapewni‡ sobie za pomoc† skrypt˘w (U*x) lub bacz˘w (MSDOS/4DOS). 3) Rozr˘§nienie standard˘w DHN i Logic jest trudne, bo sk’adaj† si‘ one z tych samych znak˘w, a r˘§nica mi‘dzy nimi polega na tym, §e cztery z nich s† zamienione kolejnožci†. QPL zazwyczaj trafnie rozpoznaje r˘§nic‘ przy u§yciu metody statystycznej (-s), jednak w wyniku podaje obie mo§liwožci. Druga z nich jest mniej prawdopodobna, ale zale§y to od samego tekstu. Historia: 1.0 pierwsza wersja .............................................................................. Autor : Pawel Krawczyk <2:486/18.4@fidonet> Najnowsza wersja : ftp://pipeta.chemia.pk.edu.pl/pub/convpl/cpl201.zip