home *** CD-ROM | disk | FTP | other *** search
/ back2roots/padua / padua.7z / padua / ftp.vapor.com / voyager / vpdf / Apdf_common.lha / Apdf / doc.orig / pdftotext.cat < prev    next >
Encoding:
Text File  |  2000-04-06  |  2.3 KB  |  133 lines

  1.  
  2.  
  3.  
  4. pdftotext(1)                                         pdftotext(1)
  5.  
  6.  
  7. NAME
  8.        pdftotext  -  Portable  Document Format (PDF) to text con-
  9.        verter (version 0.90)
  10.  
  11. SYNOPSIS
  12.        pdftotext [options] [PDF-file [text-file]]
  13.  
  14. DESCRIPTION
  15.        Pdftotext converts Portable Document Format (PDF) files to
  16.        plain text.
  17.  
  18.        Pdftotext  reads the PDF file, PDF-file, and writes a text
  19.        file, text-file.  If text-file is not specified, pdftotext
  20.        converts  file.pdf  to file.txt.  If text-file is '-', the
  21.        text is sent to stdout.
  22.  
  23. OPTIONS
  24.        -f number
  25.               Specifies the first page to convert.
  26.  
  27.        -l number
  28.               Specifies the last page to convert.
  29.  
  30.        -ascii7
  31.               Convert the text to 7-bit ASCII; the default is  to
  32.               use the 8-bit ISO Latin-1 character set.
  33.  
  34.        -eucjp Convert Japanese text to EUC-JP.  This is currently
  35.               the only option for converting Japanese text -- the
  36.               only  effect  is  to switch to 7-bit ASCII for non-
  37.               Japanese text, in order  to  fit  into  the  EUC-JP
  38.               encoding.  (This option is only available if pdfto-
  39.               text was compiled with Japanese support.)
  40.  
  41.        -raw   Keep the text in content stream order.  This  is  a
  42.               hack  which  often "undoes" column formatting, etc.
  43.               This option will likely be replaced with  something
  44.               more  sophisticated  when pdftotext is rewritten to
  45.               use a smarter text placement algorithm.
  46.  
  47.        -q     Don't print any messages or errors.
  48.  
  49.        -h     Print usage information.  (-help is equivalent.)
  50.  
  51. BUGS
  52.        Some PDF files contain fonts  whose  encodings  have  been
  53.        mangled  beyond  recognition.   There  is no way (short of
  54.        OCR) to extract text from these files.
  55.  
  56. AUTHOR
  57.        The pdftotext software  and  documentation  are  copyright
  58.        1996-1999 Derek B. Noonburg (derekn@foolabs.com).
  59.  
  60.  
  61.  
  62.  
  63.  
  64.                            02 Aug 1999                          1
  65.  
  66.  
  67.  
  68.  
  69.  
  70. pdftotext(1)                                         pdftotext(1)
  71.  
  72.  
  73. SEE ALSO
  74.        xpdf(1), pdftops(1), pdfinfo(1), pdftopbm(1), pdfimages(1)
  75.        http://www.foolabs.com/xpdf/
  76.  
  77.  
  78.  
  79.  
  80.  
  81.  
  82.  
  83.  
  84.  
  85.  
  86.  
  87.  
  88.  
  89.  
  90.  
  91.  
  92.  
  93.  
  94.  
  95.  
  96.  
  97.  
  98.  
  99.  
  100.  
  101.  
  102.  
  103.  
  104.  
  105.  
  106.  
  107.  
  108.  
  109.  
  110.  
  111.  
  112.  
  113.  
  114.  
  115.  
  116.  
  117.  
  118.  
  119.  
  120.  
  121.  
  122.  
  123.  
  124.  
  125.  
  126.  
  127.  
  128.  
  129.  
  130.                            02 Aug 1999                          2
  131.  
  132.  
  133.