home *** CD-ROM | disk | FTP | other *** search
/ PC World Komputer 1998 January / Pcwk0198.iso / Zadarmo / Convert / QPL.TXT < prev   
Text File  |  1996-01-31  |  4KB  |  93 lines

  1. [QueryPL] by kravietZ                                               15.01.96
  2.                                                                     (Mazovia)
  3.  
  4.  
  5.  
  6.                            Narzædzie do rozpoznawania
  7.                            standardów polskich znaków
  8.                                       v1.0
  9.  
  10.  
  11.  
  12. QueryPL v1.0 jest programem freeware, rozprowadzanym wraz z kodem
  13. ªródÆowym. SÆuºy do rozpoznawania standardu kodowania polskich znaków
  14. w plikach tekstowych, je₧li standard ten jest nieznany lub niepewny.
  15.  
  16. :SK£ADNIA:
  17. ~~~~~~~~~~
  18.  
  19.              qpl <plik> [-s | -v | -b]
  20.  
  21. Jako pierwszy argument podaje siæ zawsze plik który ma byì sprawdzony.
  22. Po nazwie pliku mogå nastæpowaì dwa opcjonalne argumenty:
  23.  
  24.         -s      uºycie metody statystycznej, generalnie pewniejszej
  25.                 i koniecznej w niektórych wypadkach; patrz rozdziaÆ
  26.                 ALGORYTM i UWAGI nr 3.
  27.  
  28.         -v      wy₧wietlenie szczegóÆowych informacji o pracy programu,
  29.                 tabeli zgodno₧ci itp.
  30.  
  31.         -b      podanie wyniku analizy w postaci parametru dla
  32.                 programu ConvPL - cyfry lub litery; opcji tej moºna
  33.                 uzyì do automatycznego konwertowania plików
  34.                 o nieznanym standardzie, podstawiajac uzyskany znak
  35.                 do linii poleceñ CPL jako standard ªródÆowy; patrz
  36.                 dokumentacja ConvPL; opcja -b automatycznie wyÆåcza
  37.                 opcjæ -v
  38.  
  39. :ALGORYTM:
  40. ~~~~~~~~~~
  41. Zasada dziaÆania jest nastæpujåca: zliczane så wszystkie wyståpienia
  42. wszystkich polskich znaków narodowych. Poniewaº znaki powtarzajå siæ
  43. w róºnych standardach, kaºde wyståpienie jest zliczane oddzielnie
  44. dla kaºdego ze standardów. Nastæpnie wyståpienia wszystkich znaków
  45. så sumowane w obræbie standardów. Wygrywa standard, w którym zmie₧ciÆo
  46. siæ wiæcej znaków znalezionych w tek₧cie.
  47.  
  48. Moºe siæ zdarzyì ºe w tek₧cie bædå wystæpowaì znaki nie majåce funkcji
  49. znaków diakrytycznych (np. jako elementy tabelki), ale naleºåce do którego₧
  50. z licznych standardów. W pewnych przypadkach mogå one zmieniì wynik analizy
  51. zwykÆych zliczeñ, prowadzåc do zÆego wyboru standardu. Dla zapobieºenia
  52. temu QPL moºe dodatkowo wykorzystaì wiedzæ o tym, jak czæsto kaºdy z
  53. znaków diakrytycznych wystæpuje w normalnym, polskim tek₧cie. Metodæ
  54. statystycznå, wykorzystujåcå tæ funkcjæ, wÆåcza siæ opcjå -s.
  55.  
  56. W tym wypadku, przed zsumowaniem zliczeñ kaºde z nich zostanie pomnoºone
  57. przez odpowiedni wspóÆczynnik, wskazujåcy z jakå czæstotliwo₧ciå dana
  58. litera zwykle wystæpuje. Tabelæ zliczeñ znaków dla obu metod wy₧wietla
  59. opcja -v.
  60.  
  61. Opcji -s naleºy uºywaì do tekstów, w których poza normalnymi polskimi
  62. znakami wystæpujå inne znaki, mogåce byì znakami diakrytycznymi w jakim₧
  63. innym standardzie. Warto siæ teº upewniì, gdy metoda standardowa daje
  64. w wyniku jaki₧ rzadki i niespotykany standard.
  65.  
  66. :UWAGI:
  67. ~~~~~~~
  68. 1) Winietka programu i wszystkie informacje så wy₧wietlane na stderr,
  69. dziæki czemu så "niewidzialne" przy zrzucaniu wyj₧cia do pliku,
  70. filtrowaniu itp. Tabela zgodno₧ci (-v) i wynik - parametr dla ConvPL (-b)
  71. så natomiast wy₧wietlane na stdout.
  72.  
  73. 2) QPL jest rozprowadzany razem z konwerterem ConvPL. ZdecydowaÆem siæ
  74. na rozprowadzanie go w postaci odræbnego programu z powodów praktycznych.
  75. Jako taki, moºe on mieì wiæksze moºliwo₧ci, wiæcej zastosowañ i bogatszå
  76. liniæ poleceñ. WspóÆpracæ miædzy obydwoma programami moºna do₧ç Æatwo
  77. zapewniç sobie za pomocå skryptów (U*x) lub baczów (MSDOS/4DOS).
  78.  
  79. 3) Rozróºnienie standardów DHN i Logic jest trudne, bo skÆadajå siæ one
  80. z tych samych znaków, a róºnica miædzy nimi polega na tym, ºe cztery
  81. z nich så zamienione kolejno₧ciå. QPL zazwyczaj trafnie rozpoznaje róºnicæ
  82. przy uºyciu metody statystycznej (-s), jednak w wyniku podaje obie moºliwo₧ci.
  83. Druga z nich jest mniej prawdopodobna, ale zaleºy to od samego tekstu.
  84.               
  85. Historia:
  86. 1.0     pierwsza wersja
  87.  
  88. ..............................................................................
  89. Autor            : Pawel Krawczyk <kravietz@pipeta.chemia.pk.edu.pl>
  90.                                   <2:486/18.4@fidonet>
  91. Najnowsza wersja : ftp://pipeta.chemia.pk.edu.pl/pub/convpl/cpl201.zip
  92.  
  93.