home *** CD-ROM | disk | FTP | other *** search
/ Chip 2004 November / CMCD1104.ISO / Software / Complet / Apache / apache_2.0.52-win32-x86-no_ssl.msi / Data.Cab / F277852_cgi.xml < prev    next >
Extensible Markup Language  |  2004-04-17  |  24KB  |  568 lines

  1. <?xml version='1.0' encoding='UTF-8' ?>
  2. <!DOCTYPE manualpage SYSTEM "../style/manualpage.dtd">
  3. <?xml-stylesheet type="text/xsl" href="../style/manual.en.xsl"?>
  4. <!-- $Revision: 1.2.2.9 $ -->
  5.  
  6. <!--
  7.  Copyright 2002-2004 The Apache Software Foundation
  8.  
  9.  Licensed under the Apache License, Version 2.0 (the "License");
  10.  you may not use this file except in compliance with the License.
  11.  You may obtain a copy of the License at
  12.  
  13.      http://www.apache.org/licenses/LICENSE-2.0
  14.  
  15.  Unless required by applicable law or agreed to in writing, software
  16.  distributed under the License is distributed on an "AS IS" BASIS,
  17.  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  18.  See the License for the specific language governing permissions and
  19.  limitations under the License.
  20. -->
  21.  
  22. <manualpage metafile="cgi.xml.meta">
  23.   <parentdocument href="./">How-To / Tutorials</parentdocument>
  24.  
  25.   <title>Apache Tutorial: Dynamic Content with CGI</title>
  26.  
  27.   <section id="intro">
  28.     <title>Introduction</title>
  29.  
  30.     <related>
  31.       <modulelist>
  32.         <module>mod_alias</module>
  33.         <module>mod_cgi</module>
  34.       </modulelist>
  35.  
  36.       <directivelist>
  37.         <directive module="mod_mime">AddHandler</directive>
  38.         <directive module="core">Options</directive>
  39.         <directive module="mod_alias">ScriptAlias</directive>
  40.       </directivelist>
  41.     </related>
  42.  
  43.     <p>The CGI (Common Gateway Interface) defines a way for a web
  44.     server to interact with external content-generating programs,
  45.     which are often referred to as CGI programs or CGI scripts. It
  46.     is the simplest, and most common, way to put dynamic content on
  47.     your web site. This document will be an introduction to setting
  48.     up CGI on your Apache web server, and getting started writing
  49.     CGI programs.</p>
  50.   </section>
  51.  
  52.   <section id="configuring">
  53.     <title>Configuring Apache to permit CGI</title>
  54.  
  55.     <p>In order to get your CGI programs to work properly, you'll
  56.     need to have Apache configured to permit CGI execution. There
  57.     are several ways to do this.</p>
  58.  
  59.     <section id="scriptalias">
  60.       <title>ScriptAlias</title>
  61.  
  62.       <p>The 
  63.       <directive module="mod_alias">ScriptAlias</directive>
  64.  
  65.       directive tells Apache that a particular directory is set
  66.       aside for CGI programs. Apache will assume that every file in
  67.       this directory is a CGI program, and will attempt to execute
  68.       it, when that particular resource is requested by a
  69.       client.</p>
  70.  
  71.       <p>The <directive module="mod_alias">ScriptAlias</directive>
  72.       directive looks like:</p>
  73.  
  74.       <example>
  75.         ScriptAlias /cgi-bin/ /usr/local/apache2/cgi-bin/
  76.       </example>
  77.  
  78.       <p>The example shown is from your default <code>httpd.conf</code>
  79.       configuration file, if you installed Apache in the default
  80.       location. The <directive module="mod_alias">ScriptAlias</directive>
  81.       directive is much like the <directive module="mod_alias"
  82.       >Alias</directive> directive, which defines a URL prefix that
  83.       is to mapped to a particular directory. <directive>Alias</directive>
  84.       and <directive>ScriptAlias</directive> are usually used for
  85.       directories that are outside of the <directive module="core"
  86.       >DocumentRoot</directive> directory. The difference between
  87.       <directive>Alias</directive> and <directive>ScriptAlias</directive>
  88.       is that <directive>ScriptAlias</directive> has the added meaning
  89.       that everything under that URL prefix will be considered a CGI
  90.       program. So, the example above tells Apache that any request for a
  91.       resource beginning with <code>/cgi-bin/</code> should be served from
  92.       the directory  <code>/usr/local/apache2/cgi-bin/</code>, and should be
  93.       treated as a CGI program.</p>
  94.  
  95.       <p>For example, if the URL
  96.       <code>http://www.example.com/cgi-bin/test.pl</code>
  97.       is requested, Apache will attempt to execute the file 
  98.       <code>/usr/local/apache2/cgi-bin/test.pl</code>
  99.       and return the output. Of course, the file will have to
  100.       exist, and be executable, and return output in a particular
  101.       way, or Apache will return an error message.</p>
  102.     </section>
  103.  
  104.     <section id="nonscriptalias">
  105.       <title>CGI outside of ScriptAlias directories</title>
  106.  
  107.       <p>CGI programs are often restricted to <directive module="mod_alias"
  108.       >ScriptAlias</directive>'ed directories for security reasons.
  109.       In this way, administrators can tightly control who is allowed to
  110.       use CGI programs. However, if the proper security precautions are
  111.       taken, there is no reason why CGI programs cannot be run from
  112.       arbitrary directories. For example, you may wish to let users
  113.       have web content in their home directories with the 
  114.       <directive module="mod_userdir">UserDir</directive> directive.
  115.       If they want to have their own CGI programs, but don't have access to
  116.       the main <code>cgi-bin</code> directory, they will need to be able to
  117.       run CGI programs elsewhere.</p>
  118.  
  119.       <p>There are two steps to allowing CGI execution in an arbitrary
  120.       directory.  First, the <code>cgi-script</code> handler must be
  121.       activated using the <directive
  122.       module="mod_mime">AddHandler</directive> or <directive
  123.       module="core">SetHandler</directive> directive.  Second,
  124.       <code>ExecCGI</code> must be specified in the <directive
  125.       module="core">Options</directive> directive.</p> 
  126.     </section>
  127.  
  128.     <section id="options">
  129.       <title>Explicitly using Options to permit CGI execution</title>
  130.  
  131.       <p>You could explicitly use the <directive module="core"
  132.       >Options</directive> directive, inside your main server configuration
  133.       file, to specify that CGI execution was permitted in a particular
  134.       directory:</p>
  135.  
  136.       <example>
  137.         <Directory /usr/local/apache2/htdocs/somedir><br />
  138.         <indent>
  139.           Options +ExecCGI<br />
  140.         </indent>
  141.         </Directory>
  142.       </example>
  143.  
  144.       <p>The above directive tells Apache to permit the execution
  145.       of CGI files. You will also need to tell the server what
  146.       files are CGI files. The following <directive module="mod_mime"
  147.       >AddHandler</directive> directive tells the server to treat all
  148.       files with the <code>cgi</code> or <code>pl</code> extension as CGI
  149.       programs:</p>
  150.  
  151.       <example>
  152.         AddHandler cgi-script .cgi .pl
  153.       </example>
  154.     </section>
  155.  
  156.     <section id="htaccess">
  157.       <title>.htaccess files</title>
  158.  
  159.       <p>The <a href="htaccess.html"><code>.htaccess</code> tutorial</a>
  160.       shows how to activate CGI programs if you do not have
  161.       access to <code>httpd.conf</code>.</p>
  162.     </section>
  163.  
  164.     <section id="userdir">
  165.       <title>User Directories</title>
  166.  
  167.       <p>To allow CGI program execution for any file ending in
  168.       <code>.cgi</code> in users' directories, you can use the
  169.       following configuration.</p>
  170.  
  171.       <example>
  172.       <Directory /home/*/public_html><br/>
  173.       <indent>
  174.         Options +ExecCGI<br/>
  175.         AddHandler cgi-script .cgi<br/>
  176.       </indent>
  177.       </Directory>
  178.       </example>
  179.  
  180.       <p>If you wish designate a <code>cgi-bin</code> subdirectory of
  181.       a user's directory where everything will be treated as a CGI
  182.       program, you can use the following.</p>
  183.  
  184.       <example>
  185.       <Directory /home/*/public_html/cgi-bin><br/>
  186.       <indent>
  187.         Options ExecCGI<br/>
  188.         SetHandler cgi-script<br/>
  189.       </indent>
  190.       </Directory>
  191.       </example>
  192.  
  193.     </section>
  194.  
  195.   </section>
  196.  
  197.   <section id="writing">
  198.     <title>Writing a CGI program</title>
  199.  
  200.     <p>There are two main differences between ``regular''
  201.     programming, and CGI programming.</p>
  202.  
  203.     <p>First, all output from your CGI program must be preceded by
  204.     a MIME-type header. This is HTTP header that tells the client
  205.     what sort of content it is receiving. Most of the time, this
  206.     will look like:</p>
  207.  
  208.     <example>
  209.       Content-type: text/html
  210.     </example>
  211.  
  212.     <p>Secondly, your output needs to be in HTML, or some other
  213.     format that a browser will be able to display. Most of the
  214.     time, this will be HTML, but occasionally you might write a CGI
  215.     program that outputs a gif image, or other non-HTML
  216.     content.</p>
  217.  
  218.     <p>Apart from those two things, writing a CGI program will look
  219.     a lot like any other program that you might write.</p>
  220.  
  221.     <section id="firstcgi">
  222.       <title>Your first CGI program</title>
  223.  
  224.       <p>The following is an example CGI program that prints one
  225.       line to your browser. Type in the following, save it to a
  226.       file called <code>first.pl</code>, and put it in your 
  227.       <code>cgi-bin</code> directory.</p>
  228.  
  229.       <example>
  230.         #!/usr/bin/perl<br />
  231.         print "Content-type: text/html\n\n";<br />
  232.         print "Hello, World.";
  233.       </example>
  234.  
  235.       <p>Even if you are not familiar with Perl, you should be able
  236.       to see what is happening here. The first line tells Apache
  237.       (or whatever shell you happen to be running under) that this
  238.       program can be executed by feeding the file to the
  239.       interpreter found at the location <code>/usr/bin/perl</code>.
  240.       The second line prints the content-type declaration we
  241.       talked about, followed by two carriage-return newline pairs.
  242.       This puts a blank line after the header, to indicate the end
  243.       of the HTTP headers, and the beginning of the body. The third
  244.       line prints the string "Hello, World.". And that's the end
  245.       of it.</p>
  246.  
  247.       <p>If you open your favorite browser and tell it to get the
  248.       address</p>
  249.  
  250.       <example>
  251.         http://www.example.com/cgi-bin/first.pl
  252.       </example>
  253.  
  254.       <p>or wherever you put your file, you will see the one line 
  255.       <code>Hello, World.</code> appear in your browser window.
  256.       It's not very exciting, but once you get that working, you'll
  257.       have a good chance of getting just about anything working.</p>
  258.     </section>
  259.   </section>
  260.  
  261.   <section id="troubleshoot">
  262.     <title>But it's still not working!</title>
  263.  
  264.     <p>There are four basic things that you may see in your browser
  265.     when you try to access your CGI program from the web:</p>
  266.  
  267.     <dl>
  268.       <dt>The output of your CGI program</dt>
  269.       <dd>Great! That means everything worked fine.  If the output is correct,
  270.       but the browser is not processing it correctly, make sure you have the
  271.       correct <code>Content-Type</code> set in your CGI program.</dd>
  272.  
  273.       <dt>The source code of your CGI program or a "POST Method Not
  274.       Allowed" message</dt>
  275.       <dd>That means that you have not properly configured Apache
  276.       to process your CGI program. Reread the section on 
  277.       <a href="#configuring">configuring
  278.       Apache</a> and try to find what you missed.</dd>
  279.  
  280.       <dt>A message starting with "Forbidden"</dt>
  281.       <dd>That means that there is a permissions problem. Check the
  282.       <a href="#errorlogs">Apache error log</a> and the section below on
  283.       <a href="#permissions">file permissions</a>.</dd>
  284.  
  285.       <dt>A message saying "Internal Server Error"</dt>
  286.       <dd>If you check the 
  287.       <a href="#errorlogs">Apache error log</a>, you will probably
  288.       find that it says "Premature end of
  289.       script headers", possibly along with an error message
  290.       generated by your CGI program. In this case, you will want to
  291.       check each of the below sections to see what might be
  292.       preventing your CGI program from emitting the proper HTTP
  293.       headers.</dd>
  294.     </dl>
  295.  
  296.     <section id="permissions">
  297.       <title>File permissions</title>
  298.  
  299.       <p>Remember that the server does not run as you. That is,
  300.       when the server starts up, it is running with the permissions
  301.       of an unprivileged user - usually <code>nobody</code>, or
  302.       <code>www</code> - and so it will need extra permissions to
  303.       execute files that are owned by you. Usually, the way to give
  304.       a file sufficient permissions to be executed by <code>nobody</code>
  305.       is to give everyone execute permission on the file:</p>
  306.  
  307.       <example>
  308.         chmod a+x first.pl
  309.       </example>
  310.  
  311.       <p>Also, if your program reads from, or writes to, any other
  312.       files, those files will need to have the correct permissions
  313.       to permit this.</p>
  314.  
  315.     </section>
  316.  
  317.     <section id="pathinformation">
  318.       <title>Path information and environment</title>
  319.  
  320.       <p>When you run a program from your command line, you have
  321.       certain information that is passed to the shell without you
  322.       thinking about it. For example, you have a <code>PATH</code>,
  323.       which tells the shell where it can look for files that you
  324.       reference.</p>
  325.  
  326.       <p>When a program runs through the web server as a CGI program,
  327.       it may not have the same <code>PATH</code>. Any programs that you
  328.       invoke in your CGI program (like <code>sendmail</code>, for
  329.       example) will need to be specified by a full path, so that the
  330.       shell can find them when it attempts to execute your CGI
  331.       program.</p>
  332.  
  333.       <p>A common manifestation of this is the path to the script
  334.       interpreter (often <code>perl</code>) indicated in the first
  335.       line of your CGI program, which will look something like:</p>
  336.  
  337.       <example>
  338.         #!/usr/bin/perl
  339.       </example>
  340.  
  341.       <p>Make sure that this is in fact the path to the
  342.       interpreter.</p>
  343.  
  344.       <p>In addition, if your CGI program depends on other <a
  345.       href="#env">environment variables</a>, you will need to
  346.       assure that those variables are passed by Apache.</p>
  347.  
  348.     </section>
  349.  
  350.     <section id="syntaxerrors">
  351.       <title>Program errors</title>
  352.  
  353.       <p>Most of the time when a CGI program fails, it's because of
  354.       a problem with the program itself. This is particularly true
  355.       once you get the hang of this CGI stuff, and no longer make
  356.       the above two mistakes.  The first thing to do is to make
  357.       sure that your program runs from the command line before
  358.       testing it via the web server.  For example, try:</p>
  359.  
  360.       <example>
  361.       cd /usr/local/apache2/cgi-bin<br/>
  362.       ./first.pl
  363.       </example>
  364.  
  365.       <p>(Do not call the <code>perl</code> interpreter.  The shell
  366.       and Apache should find the interpreter using the <a
  367.       href="#pathinformation">path information</a> on the first line of
  368.       the script.)</p>
  369.  
  370.       <p>The first thing you see written by your program should be
  371.       a set of HTTP headers, including the <code>Content-Type</code>,
  372.       followed by a blank line.  If you see anything else, Apache will
  373.       return the <code>Premature end of script headers</code> error if
  374.       you try to run it through the server. See <a
  375.       href="#writing">Writing a CGI program</a> above for more
  376.       details.</p>
  377.     </section>
  378.  
  379.     <section id="errorlogs">
  380.       <title>Error logs</title>
  381.  
  382.       <p>The error logs are your friend. Anything that goes wrong
  383.       generates message in the error log. You should always look
  384.       there first. If the place where you are hosting your web site
  385.       does not permit you access to the error log, you should
  386.       probably host your site somewhere else. Learn to read the
  387.       error logs, and you'll find that almost all of your problems
  388.       are quickly identified, and quickly solved.</p>
  389.     </section>
  390.  
  391.     <section id="suexec">
  392.       <title>Suexec</title>
  393.  
  394.       <p>The <a href="../suexec.html">suexec</a> support program
  395.       allows CGI programs to be run under different user permissions,
  396.       depending on which virtual host or user home directory they are
  397.       located in. Suexec has very strict permission checking, and any
  398.       failure in that checking will result in your CGI programs
  399.       failing with <code>Premature end of script headers</code>.</p>
  400.  
  401.       <p>To check if you are using suexec, run <code>apachectl
  402.       -V</code> and check for the location of <code>SUEXEC_BIN</code>.
  403.       If Apache finds an suexec binary there on startup, suexec will
  404.       be activated.</p>
  405.  
  406.       <p>Unless you fully understand suexec, you should not be using it.
  407.       To disable suexec, simply remove (or rename) the <code>suexec</code>
  408.       binary pointed to by <code>SUEXEC_BIN</code> and then restart the
  409.       server.  If, after reading about <a href="../suexec.html">suexec</a>,
  410.       you still wish to use it, then run <code>suexec -V</code> to find
  411.       the location of the suexec log file, and use that log file to
  412.       find what policy you are violating.</p>
  413.     </section>
  414.   </section>
  415.  
  416.   <section id="behindscenes">
  417.     <title>What's going on behind the scenes?</title>
  418.  
  419.     <p>As you become more advanced in CGI programming, it will
  420.     become useful to understand more about what's happening behind
  421.     the scenes. Specifically, how the browser and server
  422.     communicate with one another. Because although it's all very
  423.     well to write a program that prints "Hello, World.", it's not
  424.     particularly useful.</p>
  425.  
  426.     <section id="env">
  427.       <title>Environment variables</title>
  428.  
  429.       <p>Environment variables are values that float around you as
  430.       you use your computer. They are useful things like your path
  431.       (where the computer searches for the actual file
  432.       implementing a command when you type it), your username, your
  433.       terminal type, and so on. For a full list of your normal,
  434.       every day environment variables, type 
  435.       <code>env</code> at a command prompt.</p>
  436.  
  437.       <p>During the CGI transaction, the server and the browser
  438.       also set environment variables, so that they can communicate
  439.       with one another. These are things like the browser type
  440.       (Netscape, IE, Lynx), the server type (Apache, IIS, WebSite),
  441.       the name of the CGI program that is being run, and so on.</p>
  442.  
  443.       <p>These variables are available to the CGI programmer, and
  444.       are half of the story of the client-server communication. The
  445.       complete list of required variables is at 
  446.       <a href="http://hoohoo.ncsa.uiuc.edu/cgi/env.html"
  447.       >http://hoohoo.ncsa.uiuc.edu/cgi/env.html</a>.</p>
  448.  
  449.       <p>This simple Perl CGI program will display all of the
  450.       environment variables that are being passed around. Two
  451.       similar programs are included in the 
  452.       <code>cgi-bin</code>
  453.  
  454.       directory of the Apache distribution. Note that some
  455.       variables are required, while others are optional, so you may
  456.       see some variables listed that were not in the official list.
  457.       In addition, Apache provides many different ways for you to 
  458.       <a href="../env.html">add your own environment variables</a>
  459.       to the basic ones provided by default.</p>
  460.  
  461.       <example>
  462.         #!/usr/bin/perl<br />
  463.         print "Content-type: text/html\n\n";<br />
  464.         foreach $key (keys %ENV) {<br />
  465.         <indent>
  466.           print "$key --> $ENV{$key}<br>";<br />
  467.         </indent>
  468.         }
  469.       </example>
  470.     </section>
  471.  
  472.     <section id="stdin">
  473.       <title>STDIN and STDOUT</title>
  474.  
  475.       <p>Other communication between the server and the client
  476.       happens over standard input (<code>STDIN</code>) and standard
  477.       output (<code>STDOUT</code>). In normal everyday context, 
  478.       <code>STDIN</code> means the keyboard, or a file that a 
  479.       program is given to act on, and <code>STDOUT</code>
  480.       usually means the console or screen.</p> 
  481.  
  482.       <p>When you <code>POST</code> a web form to a CGI program,
  483.       the data in that form is bundled up into a special format
  484.       and gets delivered to your CGI program over <code>STDIN</code>.
  485.       The program then can process that data as though it was
  486.       coming in from the keyboard, or from a file</p>
  487.  
  488.       <p>The "special format" is very simple. A field name and
  489.       its value are joined together with an equals (=) sign, and
  490.       pairs of values are joined together with an ampersand
  491.       (&). Inconvenient characters like spaces, ampersands, and
  492.       equals signs, are converted into their hex equivalent so that
  493.       they don't gum up the works. The whole data string might look
  494.       something like:</p>
  495.  
  496.       <example>
  497.         name=Rich%20Bowen&city=Lexington&state=KY&sidekick=Squirrel%20Monkey
  498.       </example>
  499.  
  500.       <p>You'll sometimes also see this type of string appended to
  501.       a URL. When that is done, the server puts that string
  502.       into the environment variable called 
  503.       <code>QUERY_STRING</code>. That's called a <code>GET</code>
  504.       request. Your HTML form specifies whether a <code>GET</code>
  505.       or a <code>POST</code> is used to deliver the data, by setting the 
  506.       <code>METHOD</code> attribute in the <code>FORM</code> tag.</p>
  507.  
  508.       <p>Your program is then responsible for splitting that string
  509.       up into useful information. Fortunately, there are libraries
  510.       and modules available to help you process this data, as well
  511.       as handle other of the aspects of your CGI program.</p>
  512.     </section>
  513.   </section>
  514.  
  515.   <section id="libraries">
  516.     <title>CGI modules/libraries</title>
  517.  
  518.     <p>When you write CGI programs, you should consider using a
  519.     code library, or module, to do most of the grunt work for you.
  520.     This leads to fewer errors, and faster development.</p>
  521.  
  522.     <p>If you're writing CGI programs in Perl, modules are
  523.     available on <a href="http://www.cpan.org/">CPAN</a>. The most
  524.     popular module for this purpose is <code>CGI.pm</code>. You might
  525.     also consider <code>CGI::Lite</code>, which implements a minimal
  526.     set of functionality, which is all you need in most programs.</p>
  527.  
  528.     <p>If you're writing CGI programs in C, there are a variety of
  529.     options. One of these is the <code>CGIC</code> library, from 
  530.     <a href="http://www.boutell.com/cgic/"
  531.     >http://www.boutell.com/cgic/</a>.</p>
  532.   </section>
  533.  
  534.   <section id="moreinfo">
  535.     <title>For more information</title>
  536.  
  537.     <p>There are a large number of CGI resources on the web. You
  538.     can discuss CGI problems with other users on the Usenet group
  539.     <a href="news:comp.infosystems.www.authoring.cgi"
  540.     >comp.infosystems.www.authoring.cgi</a>. And the -servers mailing
  541.     list from the HTML Writers Guild is a great source of answers
  542.     to your questions. You can find out more at 
  543.     <a href="http://www.hwg.org/lists/hwg-servers/"
  544.     >http://www.hwg.org/lists/hwg-servers/</a>.</p>
  545.  
  546.     <p>And, of course, you should probably read the CGI
  547.     specification, which has all the details on the operation of
  548.     CGI programs. You can find the original version at the 
  549.     <a href="http://hoohoo.ncsa.uiuc.edu/cgi/interface.html"
  550.     >NCSA</a> and there is an updated draft at the 
  551.     <a href="http://web.golux.com/coar/cgi/">Common Gateway
  552.     Interface RFC project</a>.</p>
  553.  
  554.     <p>When you post a question about a CGI problem that you're
  555.     having, whether to a mailing list, or to a newsgroup, make sure
  556.     you provide enough information about what happened, what you
  557.     expected to happen, and how what actually happened was
  558.     different, what server you're running, what language your CGI
  559.     program was in, and, if possible, the offending code. This will
  560.     make finding your problem much simpler.</p>
  561.  
  562.     <p>Note that questions about CGI problems should <strong>never</strong>
  563.     be posted to the Apache bug database unless you are sure you
  564.     have found a problem in the Apache source code.</p>
  565.   </section>
  566. </manualpage>
  567.  
  568.