home *** CD-ROM | disk | FTP | other *** search
/ PC World 2004 May / PCWorld_2004-05_cd.bin / komunikace / apache / apache_2.0.48-win32-x86-no_ssl.msi / Data.Cab / F252357_cgi.xml < prev    next >
Extensible Markup Language  |  2003-04-15  |  21KB  |  493 lines

  1. <?xml version='1.0' encoding='UTF-8' ?>
  2. <!DOCTYPE manualpage SYSTEM "../style/manualpage.dtd">
  3. <?xml-stylesheet type="text/xsl" href="../style/manual.en.xsl"?>
  4. <manualpage metafile="cgi.xml.meta">
  5.   <parentdocument href="./">How-To / Tutorials</parentdocument>
  6.  
  7.   <title>Apache Tutorial: Dynamic Content with CGI</title>
  8.  
  9.   <section id="intro">
  10.     <title>Introduction</title>
  11.  
  12.     <related>
  13.       <modulelist>
  14.         <module>mod_alias</module>
  15.         <module>mod_cgi</module>
  16.       </modulelist>
  17.  
  18.       <directivelist>
  19.         <directive module="mod_mime">AddHandler</directive>
  20.         <directive module="core">Options</directive>
  21.         <directive module="mod_alias">ScriptAlias</directive>
  22.       </directivelist>
  23.     </related>
  24.  
  25.     <p>The CGI (Common Gateway Interface) defines a way for a web
  26.     server to interact with external content-generating programs,
  27.     which are often referred to as CGI programs or CGI scripts. It
  28.     is the simplest, and most common, way to put dynamic content on
  29.     your web site. This document will be an introduction to setting
  30.     up CGI on your Apache web server, and getting started writing
  31.     CGI programs.</p>
  32.   </section>
  33.  
  34.   <section id="configuring">
  35.     <title>Configuring Apache to permit CGI</title>
  36.  
  37.     <p>In order to get your CGI programs to work properly, you'll
  38.     need to have Apache configured to permit CGI execution. There
  39.     are several ways to do this.</p>
  40.  
  41.     <section id="scriptalias">
  42.       <title>ScriptAlias</title>
  43.  
  44.       <p>The 
  45.       <directive module="mod_alias">ScriptAlias</directive>
  46.  
  47.       directive tells Apache that a particular directory is set
  48.       aside for CGI programs. Apache will assume that every file in
  49.       this directory is a CGI program, and will attempt to execute
  50.       it, when that particular resource is requested by a
  51.       client.</p>
  52.  
  53.       <p>The <directive module="mod_alias">ScriptAlias</directive>
  54.       directive looks like:</p>
  55.  
  56.       <example>
  57.         ScriptAlias /cgi-bin/ /usr/local/apache/cgi-bin/
  58.       </example>
  59.  
  60.       <p>The example shown is from your default <code>httpd.conf</code>
  61.       configuration file, if you installed Apache in the default
  62.       location. The <directive module="mod_alias">ScriptAlias</directive>
  63.       directive is much like the <directive module="mod_alias"
  64.       >Alias</directive> directive, which defines a URL prefix that
  65.       is to mapped to a particular directory. <directive>Alias</directive>
  66.       and <directive>ScriptAlias</directive> are usually used for
  67.       directories that are outside of the <directive module="core"
  68.       >DocumentRoot</directive> directory. The difference between
  69.       <directive>Alias</directive> and <directive>ScriptAlias</directive>
  70.       is that <directive>ScriptAlias</directive> has the added meaning
  71.       that everything under that URL prefix will be considered a CGI
  72.       program. So, the example above tells Apache that any request for a
  73.       resource beginning with <code>/cgi-bin/</code> should be served from
  74.       the directory  <code>/usr/local/apache/cgi-bin/</code>, and should be
  75.       treated as a CGI program.</p>
  76.  
  77.       <p>For example, if the URL
  78.       <code>http://www.example.com/cgi-bin/test.pl</code>
  79.       is requested, Apache will attempt to execute the file 
  80.       <code>/usr/local/apache/cgi-bin/test.pl</code>
  81.       and return the output. Of course, the file will have to
  82.       exist, and be executable, and return output in a particular
  83.       way, or Apache will return an error message.</p>
  84.     </section>
  85.  
  86.     <section id="nonscriptalias">
  87.       <title>CGI outside of ScriptAlias directories</title>
  88.  
  89.       <p>CGI programs are often restricted to <directive module="mod_alias"
  90.       >ScriptAlias</directive>'ed directories for security reasons.
  91.       In this way, administrators can tightly control who is allowed to
  92.       use CGI programs. However, if the proper security precautions are
  93.       taken, there is no reason why CGI programs cannot be run from
  94.       arbitrary directories. For example, you may wish to let users
  95.       have web content in their home directories with the 
  96.       <directive module="mod_userdir">UserDir</directive> directive.
  97.       If they want to have their own CGI programs, but don't have access to
  98.       the main <code>cgi-bin</code> directory, they will need to be able to
  99.       run CGI programs elsewhere.</p>
  100.     </section>
  101.  
  102.     <section id="options">
  103.       <title>Explicitly using Options to permit CGI execution</title>
  104.  
  105.       <p>You could explicitly use the <directive module="core"
  106.       >Options</directive> directive, inside your main server configuration
  107.       file, to specify that CGI execution was permitted in a particular
  108.       directory:</p>
  109.  
  110.       <example>
  111.         <Directory /usr/local/apache/htdocs/somedir><br />
  112.         <indent>
  113.           Options +ExecCGI<br />
  114.         </indent>
  115.         </Directory>
  116.       </example>
  117.  
  118.       <p>The above directive tells Apache to permit the execution
  119.       of CGI files. You will also need to tell the server what
  120.       files are CGI files. The following <directive module="mod_mime"
  121.       >AddHandler</directive> directive tells the server to treat all
  122.       files with the <code>cgi</code> or <code>pl</code> extension as CGI
  123.       programs:</p>
  124.  
  125.       <example>
  126.         AddHandler cgi-script cgi pl
  127.       </example>
  128.     </section>
  129.  
  130.     <section id="htaccess">
  131.       <title>.htaccess files</title>
  132.  
  133.       <p>A <a href="htaccess.html"><code>.htaccess</code> file</a> is a way
  134.       to set configuration directives on a per-directory basis. When Apache
  135.       serves a resource, it looks in the directory from which it is serving
  136.       a file for a file called <code>.htaccess</code>, and, if it 
  137.       finds it, it will apply directives found therein.  
  138.       
  139.       <code>.htaccess</code> files can be permitted with the 
  140.       <directive module="core">AllowOverride</directive> directive,
  141.       which specifies what types of directives can
  142.       appear in these files, or if they are not allowed at all. To
  143.       permit the directive we will need for this purpose, the
  144.       following configuration will be needed in your main server
  145.       configuration:</p>
  146.  
  147.       <example>
  148.         AllowOverride Options
  149.       </example>
  150.  
  151.       <p>In the <code>.htaccess</code> file, you'll need the 
  152.       following directive:</p>
  153.  
  154.       <example>
  155.         Options +ExecCGI
  156.       </example>
  157.  
  158.       <p>which tells Apache that execution of CGI programs is
  159.       permitted in this directory.</p>
  160.     </section>
  161.   </section>
  162.  
  163.   <section id="writing">
  164.     <title>Writing a CGI program</title>
  165.  
  166.     <p>There are two main differences between ``regular''
  167.     programming, and CGI programming.</p>
  168.  
  169.     <p>First, all output from your CGI program must be preceded by
  170.     a MIME-type header. This is HTTP header that tells the client
  171.     what sort of content it is receiving. Most of the time, this
  172.     will look like:</p>
  173.  
  174.     <example>
  175.       Content-type: text/html
  176.     </example>
  177.  
  178.     <p>Secondly, your output needs to be in HTML, or some other
  179.     format that a browser will be able to display. Most of the
  180.     time, this will be HTML, but occasionally you might write a CGI
  181.     program that outputs a gif image, or other non-HTML
  182.     content.</p>
  183.  
  184.     <p>Apart from those two things, writing a CGI program will look
  185.     a lot like any other program that you might write.</p>
  186.  
  187.     <section id="firstcgi">
  188.       <title>Your first CGI program</title>
  189.  
  190.       <p>The following is an example CGI program that prints one
  191.       line to your browser. Type in the following, save it to a
  192.       file called <code>first.pl</code>, and put it in your 
  193.       <code>cgi-bin</code> directory.</p>
  194.  
  195.       <example>
  196.         #!/usr/bin/perl<br />
  197.         print "Content-type: text/html\n\n";<br />
  198.         print "Hello, World.";
  199.       </example>
  200.  
  201.       <p>Even if you are not familiar with Perl, you should be able
  202.       to see what is happening here. The first line tells Apache
  203.       (or whatever shell you happen to be running under) that this
  204.       program can be executed by feeding the file to the
  205.       interpreter found at the location <code>/usr/bin/perl</code>.
  206.       The second line prints the content-type declaration we
  207.       talked about, followed by two carriage-return newline pairs.
  208.       This puts a blank line after the header, to indicate the end
  209.       of the HTTP headers, and the beginning of the body. The third
  210.       line prints the string "Hello, World.". And that's the end
  211.       of it.</p>
  212.  
  213.       <p>If you open your favorite browser and tell it to get the
  214.       address</p>
  215.  
  216.       <example>
  217.         http://www.example.com/cgi-bin/first.pl
  218.       </example>
  219.  
  220.       <p>or wherever you put your file, you will see the one line 
  221.       <code>Hello, World.</code> appear in your browser window.
  222.       It's not very exciting, but once you get that working, you'll
  223.       have a good chance of getting just about anything working.</p>
  224.     </section>
  225.   </section>
  226.  
  227.   <section id="troubleshoot">
  228.     <title>But it's still not working!</title>
  229.  
  230.     <p>There are four basic things that you may see in your browser
  231.     when you try to access your CGI program from the web:</p>
  232.  
  233.     <dl>
  234.       <dt>The output of your CGI program</dt>
  235.       <dd>Great! That means everything worked fine.</dd>
  236.  
  237.       <dt>The source code of your CGI program or a "POST Method Not
  238.       Allowed" message</dt>
  239.       <dd>That means that you have not properly configured Apache
  240.       to process your CGI program. Reread the section on 
  241.       <a href="#configuringapachetopermitcgi">configuring
  242.       Apache</a> and try to find what you missed.</dd>
  243.  
  244.       <dt>A message starting with "Forbidden"</dt>
  245.       <dd>That means that there is a permissions problem. Check the
  246.       <a href="#errorlogs">Apache error log</a> and the section below on
  247.       <a href="#permissions">file permissions</a>.</dd>
  248.  
  249.       <dt>A message saying "Internal Server Error"</dt>
  250.       <dd>If you check the 
  251.       <a href="#errorlogs">Apache error log</a>, you will probably
  252.       find that it says "Premature end of
  253.       script headers", possibly along with an error message
  254.       generated by your CGI program. In this case, you will want to
  255.       check each of the below sections to see what might be
  256.       preventing your CGI program from emitting the proper HTTP
  257.       headers.</dd>
  258.     </dl>
  259.  
  260.     <section id="permissions">
  261.       <title>File permissions</title>
  262.  
  263.       <p>Remember that the server does not run as you. That is,
  264.       when the server starts up, it is running with the permissions
  265.       of an unprivileged user - usually <code>nobody</code>, or
  266.       <code>www</code> - and so it will need extra permissions to
  267.       execute files that are owned by you. Usually, the way to give
  268.       a file sufficient permissions to be executed by <code>nobody</code>
  269.       is to give everyone execute permission on the file:</p>
  270.  
  271.       <example>
  272.         chmod a+x first.pl
  273.       </example>
  274.  
  275.       <p>Also, if your program reads from, or writes to, any other
  276.       files, those files will need to have the correct permissions
  277.       to permit this.</p>
  278.  
  279.       <p>The exception to this is when the server is configured to
  280.       use <a href="../suexec.html">suexec</a>. This program allows
  281.       CGI programs to be run under different
  282.       user permissions, depending on which virtual host or user
  283.       home directory they are located in. Suexec has very strict
  284.       permission checking, and any failure in that checking will
  285.       result in your CGI programs failing with an "Internal Server
  286.       Error". In this case, you will need to check the suexec log
  287.       file to see what specific security check is failing.</p>
  288.     </section>
  289.  
  290.     <section id="pathinformation">
  291.       <title>Path information</title>
  292.  
  293.       <p>When you run a program from your command line, you have
  294.       certain information that is passed to the shell without you
  295.       thinking about it. For example, you have a path, which tells
  296.       the shell where it can look for files that you reference.</p>
  297.  
  298.       <p>When a program runs through the web server as a CGI
  299.       program, it does not have that path. Any programs that you
  300.       invoke in your CGI program (like 'sendmail', for example)
  301.       will need to be specified by a full path, so that the shell
  302.       can find them when it attempts to execute your CGI
  303.       program.</p>
  304.  
  305.       <p>A common manifestation of this is the path to the script
  306.       interpreter (often <code>perl</code>) indicated in the first
  307.       line of your CGI program, which will look something like:</p>
  308.  
  309.       <example>
  310.         #!/usr/bin/perl
  311.       </example>
  312.  
  313.       <p>Make sure that this is in fact the path to the
  314.       interpreter.</p>
  315.     </section>
  316.  
  317.     <section id="syntaxerrors">
  318.       <title>Syntax errors</title>
  319.  
  320.       <p>Most of the time when a CGI program fails, it's because of
  321.       a problem with the program itself. This is particularly true
  322.       once you get the hang of this CGI stuff, and no longer make
  323.       the above two mistakes. Always attempt to run your program
  324.       from the command line before you test if via a browser. This
  325.       will eliminate most of your problems.</p>
  326.     </section>
  327.  
  328.     <section id="errorlogs">
  329.       <title>Error logs</title>
  330.  
  331.       <p>The error logs are your friend. Anything that goes wrong
  332.       generates message in the error log. You should always look
  333.       there first. If the place where you are hosting your web site
  334.       does not permit you access to the error log, you should
  335.       probably host your site somewhere else. Learn to read the
  336.       error logs, and you'll find that almost all of your problems
  337.       are quickly identified, and quickly solved.</p>
  338.     </section>
  339.   </section>
  340.  
  341.   <section id="behindscenes">
  342.     <title>What's going on behind the scenes?</title>
  343.  
  344.     <p>As you become more advanced in CGI programming, it will
  345.     become useful to understand more about what's happening behind
  346.     the scenes. Specifically, how the browser and server
  347.     communicate with one another. Because although it's all very
  348.     well to write a program that prints "Hello, World.", it's not
  349.     particularly useful.</p>
  350.  
  351.     <section id="env">
  352.       <title>Environment variables</title>
  353.  
  354.       <p>Environment variables are values that float around you as
  355.       you use your computer. They are useful things like your path
  356.       (where the computer searches for a the actual file
  357.       implementing a command when you type it), your username, your
  358.       terminal type, and so on. For a full list of your normal,
  359.       every day environment variables, type 
  360.       <code>env</code> at a command prompt.</p>
  361.  
  362.       <p>During the CGI transaction, the server and the browser
  363.       also set environment variables, so that they can communicate
  364.       with one another. These are things like the browser type
  365.       (Netscape, IE, Lynx), the server type (Apache, IIS, WebSite),
  366.       the name of the CGI program that is being run, and so on.</p>
  367.  
  368.       <p>These variables are available to the CGI programmer, and
  369.       are half of the story of the client-server communication. The
  370.       complete list of required variables is at 
  371.       <a href="http://hoohoo.ncsa.uiuc.edu/cgi/env.html"
  372.       >http://hoohoo.ncsa.uiuc.edu/cgi/env.html</a>.</p>
  373.  
  374.       <p>This simple Perl CGI program will display all of the
  375.       environment variables that are being passed around. Two
  376.       similar programs are included in the 
  377.       <code>cgi-bin</code>
  378.  
  379.       directory of the Apache distribution. Note that some
  380.       variables are required, while others are optional, so you may
  381.       see some variables listed that were not in the official list.
  382.       In addition, Apache provides many different ways for you to 
  383.       <a href="../env.html">add your own environment variables</a>
  384.       to the basic ones provided by default.</p>
  385.  
  386.       <example>
  387.         #!/usr/bin/perl<br />
  388.         print "Content-type: text/html\n\n";<br />
  389.         foreach $key (keys %ENV) {<br />
  390.         <indent>
  391.           print "$key --> $ENV{$key}<br>";<br />
  392.         </indent>
  393.         }
  394.       </example>
  395.     </section>
  396.  
  397.     <section id="stdin">
  398.       <title>STDIN and STDOUT</title>
  399.  
  400.       <p>Other communication between the server and the client
  401.       happens over standard input (<code>STDIN</code>) and standard
  402.       output (<code>STDOUT</code>). In normal everyday context, 
  403.       <code>STDIN</code> means the keyboard, or a file that a 
  404.       program is given to act on, and <code>STDOUT</code>
  405.       usually means the console or screen.</p> 
  406.  
  407.       <p>When you <code>POST</code> a web form to a CGI program,
  408.       the data in that form is bundled up into a special format
  409.       and gets delivered to your CGI program over <code>STDIN</code>.
  410.       The program then can process that data as though it was
  411.       coming in from the keyboard, or from a file</p>
  412.  
  413.       <p>The "special format" is very simple. A field name and
  414.       its value are joined together with an equals (=) sign, and
  415.       pairs of values are joined together with an ampersand
  416.       (&). Inconvenient characters like spaces, ampersands, and
  417.       equals signs, are converted into their hex equivalent so that
  418.       they don't gum up the works. The whole data string might look
  419.       something like:</p>
  420.  
  421.       <example>
  422.         name=Rich%20Bowen&city=Lexington&state=KY&sidekick=Squirrel%20Monkey
  423.       </example>
  424.  
  425.       <p>You'll sometimes also see this type of string appended to
  426.       the a URL. When that is done, the server puts that string
  427.       into the environment variable called 
  428.       <code>QUERY_STRING</code>. That's called a <code>GET</code>
  429.       request. Your HTML form specifies whether a <code>GET</code>
  430.       or a <code>POST</code> is used to deliver the data, by setting the 
  431.       <code>METHOD</code> attribute in the <code>FORM</code> tag.</p>
  432.  
  433.       <p>Your program is then responsible for splitting that string
  434.       up into useful information. Fortunately, there are libraries
  435.       and modules available to help you process this data, as well
  436.       as handle other of the aspects of your CGI program.</p>
  437.     </section>
  438.   </section>
  439.  
  440.   <section id="libraries">
  441.     <title>CGI modules/libraries</title>
  442.  
  443.     <p>When you write CGI programs, you should consider using a
  444.     code library, or module, to do most of the grunt work for you.
  445.     This leads to fewer errors, and faster development.</p>
  446.  
  447.     <p>If you're writing CGI programs in Perl, modules are
  448.     available on <a href="http://www.cpan.org/">CPAN</a>. The most
  449.     popular module for this purpose is <code>CGI.pm</code>. You might
  450.     also consider <code>CGI::Lite</code>, which implements a minimal
  451.     set of functionality, which is all you need in most programs.</p>
  452.  
  453.     <p>If you're writing CGI programs in C, there are a variety of
  454.     options. One of these is the <code>CGIC</code> library, from 
  455.     <a href="http://www.boutell.com/cgic/"
  456.     >http://www.boutell.com/cgic/</a>.</p>
  457.   </section>
  458.  
  459.   <section id="moreinfo">
  460.     <title>For more information</title>
  461.  
  462.     <p>There are a large number of CGI resources on the web. You
  463.     can discuss CGI problems with other users on the Usenet group
  464.     <a href="news:comp.infosystems.www.authoring.cgi"
  465.     >comp.infosystems.www.authoring.cgi</a>. And the -servers mailing
  466.     list from the HTML Writers Guild is a great source of answers
  467.     to your questions. You can find out more at 
  468.     <a href="http://www.hwg.org/lists/hwg-servers/"
  469.     >http://www.hwg.org/lists/hwg-servers/</a>.</p>
  470.  
  471.     <p>And, of course, you should probably read the CGI
  472.     specification, which has all the details on the operation of
  473.     CGI programs. You can find the original version at the 
  474.     <a href="http://hoohoo.ncsa.uiuc.edu/cgi/interface.html"
  475.     >NCSA</a> and there is an updated draft at the 
  476.     <a href="http://web.golux.com/coar/cgi/">Common Gateway
  477.     Interface RFC project</a>.</p>
  478.  
  479.     <p>When you post a question about a CGI problem that you're
  480.     having, whether to a mailing list, or to a newsgroup, make sure
  481.     you provide enough information about what happened, what you
  482.     expected to happen, and how what actually happened was
  483.     different, what server you're running, what language your CGI
  484.     program was in, and, if possible, the offending code. This will
  485.     make finding your problem much simpler.</p>
  486.  
  487.     <p>Note that questions about CGI problems should <strong>never</strong>
  488.     be posted to the Apache bug database unless you are sure you
  489.     have found a problem in the Apache source code.</p>
  490.   </section>
  491. </manualpage>
  492.  
  493.