home *** CD-ROM | disk | FTP | other *** search
/ PC World 2003 May / PCWorld_2003-05_cd.bin / Komunik / apache / apache_2.0.45-win32-x86-no_ssl.msi / Data.Cab / F232734_cgi.xml < prev    next >
Extensible Markup Language  |  2002-12-22  |  21KB  |  494 lines

  1. <?xml version='1.0' encoding='UTF-8' ?>
  2. <!DOCTYPE manualpage SYSTEM "../style/manualpage.dtd">
  3. <?xml-stylesheet type="text/xsl" href="../style/manual.en.xsl"?>
  4. <manualpage>
  5.   <relativepath href=".." />
  6.   <parentdocument href="./">How-To / Tutorials</parentdocument>
  7.  
  8.   <title>Apache Tutorial: Dynamic Content with CGI</title>
  9.  
  10.   <section id="intro">
  11.     <title>Introduction</title>
  12.  
  13.     <related>
  14.       <modulelist>
  15.         <module>mod_alias</module>
  16.         <module>mod_cgi</module>
  17.       </modulelist>
  18.  
  19.       <directivelist>
  20.         <directive module="mod_mime">AddHandler</directive>
  21.         <directive module="core">Options</directive>
  22.         <directive module="mod_alias">ScriptAlias</directive>
  23.       </directivelist>
  24.     </related>
  25.  
  26.     <p>The CGI (Common Gateway Interface) defines a way for a web
  27.     server to interact with external content-generating programs,
  28.     which are often referred to as CGI programs or CGI scripts. It
  29.     is the simplest, and most common, way to put dynamic content on
  30.     your web site. This document will be an introduction to setting
  31.     up CGI on your Apache web server, and getting started writing
  32.     CGI programs.</p>
  33.   </section>
  34.  
  35.   <section id="configuring">
  36.     <title>Configuring Apache to permit CGI</title>
  37.  
  38.     <p>In order to get your CGI programs to work properly, you'll
  39.     need to have Apache configured to permit CGI execution. There
  40.     are several ways to do this.</p>
  41.  
  42.     <section id="scriptalias">
  43.       <title>ScriptAlias</title>
  44.  
  45.       <p>The 
  46.       <directive module="mod_alias">ScriptAlias</directive>
  47.  
  48.       directive tells Apache that a particular directory is set
  49.       aside for CGI programs. Apache will assume that every file in
  50.       this directory is a CGI program, and will attempt to execute
  51.       it, when that particular resource is requested by a
  52.       client.</p>
  53.  
  54.       <p>The <directive module="mod_alias">ScriptAlias</directive>
  55.       directive looks like:</p>
  56.  
  57.       <example>
  58.         ScriptAlias /cgi-bin/ /usr/local/apache/cgi-bin/
  59.       </example>
  60.  
  61.       <p>The example shown is from your default <code>httpd.conf</code>
  62.       configuration file, if you installed Apache in the default
  63.       location. The <directive module="mod_alias">ScriptAlias</directive>
  64.       directive is much like the <directive module="mod_alias"
  65.       >Alias</directive> directive, which defines a URL prefix that
  66.       is to mapped to a particular directory. <directive>Alias</directive>
  67.       and <directive>ScriptAlias</directive> are usually used for
  68.       directories that are outside of the <directive module="core"
  69.       >DocumentRoot</directive> directory. The difference between
  70.       <directive>Alias</directive> and <directive>ScriptAlias</directive>
  71.       is that <directive>ScriptAlias</directive> has the added meaning
  72.       that everything under that URL prefix will be considered a CGI
  73.       program. So, the example above tells Apache that any request for a
  74.       resource beginning with <code>/cgi-bin/</code> should be served from
  75.       the directory  <code>/usr/local/apache/cgi-bin/</code>, and should be
  76.       treated as a CGI program.</p>
  77.  
  78.       <p>For example, if the URL
  79.       <code>http://www.example.com/cgi-bin/test.pl</code>
  80.       is requested, Apache will attempt to execute the file 
  81.       <code>/usr/local/apache/cgi-bin/test.pl</code>
  82.       and return the output. Of course, the file will have to
  83.       exist, and be executable, and return output in a particular
  84.       way, or Apache will return an error message.</p>
  85.     </section>
  86.  
  87.     <section id="nonscriptalias">
  88.       <title>CGI outside of ScriptAlias directories</title>
  89.  
  90.       <p>CGI programs are often restricted to <directive module="mod_alias"
  91.       >ScriptAlias</directive>'ed directories for security reasons.
  92.       In this way, administrators can tightly control who is allowed to
  93.       use CGI programs. However, if the proper security precautions are
  94.       taken, there is no reason why CGI programs cannot be run from
  95.       arbitrary directories. For example, you may wish to let users
  96.       have web content in their home directories with the 
  97.       <directive module="mod_userdir">UserDir</directive> directive.
  98.       If they want to have their own CGI programs, but don't have access to
  99.       the main <code>cgi-bin</code> directory, they will need to be able to
  100.       run CGI programs elsewhere.</p>
  101.     </section>
  102.  
  103.     <section id="options">
  104.       <title>Explicitly using Options to permit CGI execution</title>
  105.  
  106.       <p>You could explicitly use the <directive module="core"
  107.       >Options</directive> directive, inside your main server configuration
  108.       file, to specify that CGI execution was permitted in a particular
  109.       directory:</p>
  110.  
  111.       <example>
  112.         <Directory /usr/local/apache/htdocs/somedir><br />
  113.         <indent>
  114.           Options +ExecCGI<br />
  115.         </indent>
  116.         </Directory>
  117.       </example>
  118.  
  119.       <p>The above directive tells Apache to permit the execution
  120.       of CGI files. You will also need to tell the server what
  121.       files are CGI files. The following <directive module="mod_mime"
  122.       >AddHandler</directive> directive tells the server to treat all
  123.       files with the <code>cgi</code> or <code>pl</code> extension as CGI
  124.       programs:</p>
  125.  
  126.       <example>
  127.         AddHandler cgi-script cgi pl
  128.       </example>
  129.     </section>
  130.  
  131.     <section id="htaccess">
  132.       <title>.htaccess files</title>
  133.  
  134.       <p>A <a href="htaccess.html"><code>.htaccess</code> file</a> is a way
  135.       to set configuration directives on a per-directory basis. When Apache
  136.       serves a resource, it looks in the directory from which it is serving
  137.       a file for a file called <code>.htaccess</code>, and, if it 
  138.       finds it, it will apply directives found therein.  
  139.       
  140.       <code>.htaccess</code> files can be permitted with the 
  141.       <directive module="core">AllowOverride</directive> directive,
  142.       which specifies what types of directives can
  143.       appear in these files, or if they are not allowed at all. To
  144.       permit the directive we will need for this purpose, the
  145.       following configuration will be needed in your main server
  146.       configuration:</p>
  147.  
  148.       <example>
  149.         AllowOverride Options
  150.       </example>
  151.  
  152.       <p>In the <code>.htaccess</code> file, you'll need the 
  153.       following directive:</p>
  154.  
  155.       <example>
  156.         Options +ExecCGI
  157.       </example>
  158.  
  159.       <p>which tells Apache that execution of CGI programs is
  160.       permitted in this directory.</p>
  161.     </section>
  162.   </section>
  163.  
  164.   <section id="writing">
  165.     <title>Writing a CGI program</title>
  166.  
  167.     <p>There are two main differences between ``regular''
  168.     programming, and CGI programming.</p>
  169.  
  170.     <p>First, all output from your CGI program must be preceded by
  171.     a MIME-type header. This is HTTP header that tells the client
  172.     what sort of content it is receiving. Most of the time, this
  173.     will look like:</p>
  174.  
  175.     <example>
  176.       Content-type: text/html
  177.     </example>
  178.  
  179.     <p>Secondly, your output needs to be in HTML, or some other
  180.     format that a browser will be able to display. Most of the
  181.     time, this will be HTML, but occasionally you might write a CGI
  182.     program that outputs a gif image, or other non-HTML
  183.     content.</p>
  184.  
  185.     <p>Apart from those two things, writing a CGI program will look
  186.     a lot like any other program that you might write.</p>
  187.  
  188.     <section id="firstcgi">
  189.       <title>Your first CGI program</title>
  190.  
  191.       <p>The following is an example CGI program that prints one
  192.       line to your browser. Type in the following, save it to a
  193.       file called <code>first.pl</code>, and put it in your 
  194.       <code>cgi-bin</code> directory.</p>
  195.  
  196.       <example>
  197.         #!/usr/bin/perl<br />
  198.         print "Content-type: text/html\n\n";<br />
  199.         print "Hello, World.";
  200.       </example>
  201.  
  202.       <p>Even if you are not familiar with Perl, you should be able
  203.       to see what is happening here. The first line tells Apache
  204.       (or whatever shell you happen to be running under) that this
  205.       program can be executed by feeding the file to the
  206.       interpreter found at the location <code>/usr/bin/perl</code>.
  207.       The second line prints the content-type declaration we
  208.       talked about, followed by two carriage-return newline pairs.
  209.       This puts a blank line after the header, to indicate the end
  210.       of the HTTP headers, and the beginning of the body. The third
  211.       line prints the string "Hello, World.". And that's the end
  212.       of it.</p>
  213.  
  214.       <p>If you open your favorite browser and tell it to get the
  215.       address</p>
  216.  
  217.       <example>
  218.         http://www.example.com/cgi-bin/first.pl
  219.       </example>
  220.  
  221.       <p>or wherever you put your file, you will see the one line 
  222.       <code>Hello, World.</code> appear in your browser window.
  223.       It's not very exciting, but once you get that working, you'll
  224.       have a good chance of getting just about anything working.</p>
  225.     </section>
  226.   </section>
  227.  
  228.   <section id="troubleshoot">
  229.     <title>But it's still not working!</title>
  230.  
  231.     <p>There are four basic things that you may see in your browser
  232.     when you try to access your CGI program from the web:</p>
  233.  
  234.     <dl>
  235.       <dt>The output of your CGI program</dt>
  236.       <dd>Great! That means everything worked fine.</dd>
  237.  
  238.       <dt>The source code of your CGI program or a "POST Method Not
  239.       Allowed" message</dt>
  240.       <dd>That means that you have not properly configured Apache
  241.       to process your CGI program. Reread the section on 
  242.       <a href="#configuringapachetopermitcgi">configuring
  243.       Apache</a> and try to find what you missed.</dd>
  244.  
  245.       <dt>A message starting with "Forbidden"</dt>
  246.       <dd>That means that there is a permissions problem. Check the
  247.       <a href="#errorlogs">Apache error log</a> and the section below on
  248.       <a href="#permissions">file permissions</a>.</dd>
  249.  
  250.       <dt>A message saying "Internal Server Error"</dt>
  251.       <dd>If you check the 
  252.       <a href="#errorlogs">Apache error log</a>, you will probably
  253.       find that it says "Premature end of
  254.       script headers", possibly along with an error message
  255.       generated by your CGI program. In this case, you will want to
  256.       check each of the below sections to see what might be
  257.       preventing your CGI program from emitting the proper HTTP
  258.       headers.</dd>
  259.     </dl>
  260.  
  261.     <section id="permissions">
  262.       <title>File permissions</title>
  263.  
  264.       <p>Remember that the server does not run as you. That is,
  265.       when the server starts up, it is running with the permissions
  266.       of an unprivileged user - usually <code>nobody</code>, or
  267.       <code>www</code> - and so it will need extra permissions to
  268.       execute files that are owned by you. Usually, the way to give
  269.       a file sufficient permissions to be executed by <code>nobody</code>
  270.       is to give everyone execute permission on the file:</p>
  271.  
  272.       <example>
  273.         chmod a+x first.pl
  274.       </example>
  275.  
  276.       <p>Also, if your program reads from, or writes to, any other
  277.       files, those files will need to have the correct permissions
  278.       to permit this.</p>
  279.  
  280.       <p>The exception to this is when the server is configured to
  281.       use <a href="../suexec.html">suexec</a>. This program allows
  282.       CGI programs to be run under different
  283.       user permissions, depending on which virtual host or user
  284.       home directory they are located in. Suexec has very strict
  285.       permission checking, and any failure in that checking will
  286.       result in your CGI programs failing with an "Internal Server
  287.       Error". In this case, you will need to check the suexec log
  288.       file to see what specific security check is failing.</p>
  289.     </section>
  290.  
  291.     <section id="pathinformation">
  292.       <title>Path information</title>
  293.  
  294.       <p>When you run a program from your command line, you have
  295.       certain information that is passed to the shell without you
  296.       thinking about it. For example, you have a path, which tells
  297.       the shell where it can look for files that you reference.</p>
  298.  
  299.       <p>When a program runs through the web server as a CGI
  300.       program, it does not have that path. Any programs that you
  301.       invoke in your CGI program (like 'sendmail', for example)
  302.       will need to be specified by a full path, so that the shell
  303.       can find them when it attempts to execute your CGI
  304.       program.</p>
  305.  
  306.       <p>A common manifestation of this is the path to the script
  307.       interpreter (often <code>perl</code>) indicated in the first
  308.       line of your CGI program, which will look something like:</p>
  309.  
  310.       <example>
  311.         #!/usr/bin/perl
  312.       </example>
  313.  
  314.       <p>Make sure that this is in fact the path to the
  315.       interpreter.</p>
  316.     </section>
  317.  
  318.     <section id="syntaxerrors">
  319.       <title>Syntax errors</title>
  320.  
  321.       <p>Most of the time when a CGI program fails, it's because of
  322.       a problem with the program itself. This is particularly true
  323.       once you get the hang of this CGI stuff, and no longer make
  324.       the above two mistakes. Always attempt to run your program
  325.       from the command line before you test if via a browser. This
  326.       will eliminate most of your problems.</p>
  327.     </section>
  328.  
  329.     <section id="errorlogs">
  330.       <title>Error logs</title>
  331.  
  332.       <p>The error logs are your friend. Anything that goes wrong
  333.       generates message in the error log. You should always look
  334.       there first. If the place where you are hosting your web site
  335.       does not permit you access to the error log, you should
  336.       probably host your site somewhere else. Learn to read the
  337.       error logs, and you'll find that almost all of your problems
  338.       are quickly identified, and quickly solved.</p>
  339.     </section>
  340.   </section>
  341.  
  342.   <section id="behindscenes">
  343.     <title>What's going on behind the scenes?</title>
  344.  
  345.     <p>As you become more advanced in CGI programming, it will
  346.     become useful to understand more about what's happening behind
  347.     the scenes. Specifically, how the browser and server
  348.     communicate with one another. Because although it's all very
  349.     well to write a program that prints "Hello, World.", it's not
  350.     particularly useful.</p>
  351.  
  352.     <section id="env">
  353.       <title>Environment variables</title>
  354.  
  355.       <p>Environment variables are values that float around you as
  356.       you use your computer. They are useful things like your path
  357.       (where the computer searches for a the actual file
  358.       implementing a command when you type it), your username, your
  359.       terminal type, and so on. For a full list of your normal,
  360.       every day environment variables, type 
  361.       <code>env</code> at a command prompt.</p>
  362.  
  363.       <p>During the CGI transaction, the server and the browser
  364.       also set environment variables, so that they can communicate
  365.       with one another. These are things like the browser type
  366.       (Netscape, IE, Lynx), the server type (Apache, IIS, WebSite),
  367.       the name of the CGI program that is being run, and so on.</p>
  368.  
  369.       <p>These variables are available to the CGI programmer, and
  370.       are half of the story of the client-server communication. The
  371.       complete list of required variables is at 
  372.       <a href="http://hoohoo.ncsa.uiuc.edu/cgi/env.html"
  373.       >http://hoohoo.ncsa.uiuc.edu/cgi/env.html</a>.</p>
  374.  
  375.       <p>This simple Perl CGI program will display all of the
  376.       environment variables that are being passed around. Two
  377.       similar programs are included in the 
  378.       <code>cgi-bin</code>
  379.  
  380.       directory of the Apache distribution. Note that some
  381.       variables are required, while others are optional, so you may
  382.       see some variables listed that were not in the official list.
  383.       In addition, Apache provides many different ways for you to 
  384.       <a href="../env.html">add your own environment variables</a>
  385.       to the basic ones provided by default.</p>
  386.  
  387.       <example>
  388.         #!/usr/bin/perl<br />
  389.         print "Content-type: text/html\n\n";<br />
  390.         foreach $key (keys %ENV) {<br />
  391.         <indent>
  392.           print "$key --> $ENV{$key}<br>";<br />
  393.         </indent>
  394.         }
  395.       </example>
  396.     </section>
  397.  
  398.     <section id="stdin">
  399.       <title>STDIN and STDOUT</title>
  400.  
  401.       <p>Other communication between the server and the client
  402.       happens over standard input (<code>STDIN</code>) and standard
  403.       output (<code>STDOUT</code>). In normal everyday context, 
  404.       <code>STDIN</code> means the keyboard, or a file that a 
  405.       program is given to act on, and <code>STDOUT</code>
  406.       usually means the console or screen.</p> 
  407.  
  408.       <p>When you <code>POST</code> a web form to a CGI program,
  409.       the data in that form is bundled up into a special format
  410.       and gets delivered to your CGI program over <code>STDIN</code>.
  411.       The program then can process that data as though it was
  412.       coming in from the keyboard, or from a file</p>
  413.  
  414.       <p>The "special format" is very simple. A field name and
  415.       its value are joined together with an equals (=) sign, and
  416.       pairs of values are joined together with an ampersand
  417.       (&). Inconvenient characters like spaces, ampersands, and
  418.       equals signs, are converted into their hex equivalent so that
  419.       they don't gum up the works. The whole data string might look
  420.       something like:</p>
  421.  
  422.       <example>
  423.         name=Rich%20Bowen&city=Lexington&state=KY&sidekick=Squirrel%20Monkey
  424.       </example>
  425.  
  426.       <p>You'll sometimes also see this type of string appended to
  427.       the a URL. When that is done, the server puts that string
  428.       into the environment variable called 
  429.       <code>QUERY_STRING</code>. That's called a <code>GET</code>
  430.       request. Your HTML form specifies whether a <code>GET</code>
  431.       or a <code>POST</code> is used to deliver the data, by setting the 
  432.       <code>METHOD</code> attribute in the <code>FORM</code> tag.</p>
  433.  
  434.       <p>Your program is then responsible for splitting that string
  435.       up into useful information. Fortunately, there are libraries
  436.       and modules available to help you process this data, as well
  437.       as handle other of the aspects of your CGI program.</p>
  438.     </section>
  439.   </section>
  440.  
  441.   <section id="libraries">
  442.     <title>CGI modules/libraries</title>
  443.  
  444.     <p>When you write CGI programs, you should consider using a
  445.     code library, or module, to do most of the grunt work for you.
  446.     This leads to fewer errors, and faster development.</p>
  447.  
  448.     <p>If you're writing CGI programs in Perl, modules are
  449.     available on <a href="http://www.cpan.org/">CPAN</a>. The most
  450.     popular module for this purpose is <code>CGI.pm</code>. You might
  451.     also consider <code>CGI::Lite</code>, which implements a minimal
  452.     set of functionality, which is all you need in most programs.</p>
  453.  
  454.     <p>If you're writing CGI programs in C, there are a variety of
  455.     options. One of these is the <code>CGIC</code> library, from 
  456.     <a href="http://www.boutell.com/cgic/"
  457.     >http://www.boutell.com/cgic/</a>.</p>
  458.   </section>
  459.  
  460.   <section id="moreinfo">
  461.     <title>For more information</title>
  462.  
  463.     <p>There are a large number of CGI resources on the web. You
  464.     can discuss CGI problems with other users on the Usenet group
  465.     <a href="news:comp.infosystems.www.authoring.cgi"
  466.     >comp.infosystems.www.authoring.cgi</a>. And the -servers mailing
  467.     list from the HTML Writers Guild is a great source of answers
  468.     to your questions. You can find out more at 
  469.     <a href="http://www.hwg.org/lists/hwg-servers/"
  470.     >http://www.hwg.org/lists/hwg-servers/</a>.</p>
  471.  
  472.     <p>And, of course, you should probably read the CGI
  473.     specification, which has all the details on the operation of
  474.     CGI programs. You can find the original version at the 
  475.     <a href="http://hoohoo.ncsa.uiuc.edu/cgi/interface.html"
  476.     >NCSA</a> and there is an updated draft at the 
  477.     <a href="http://web.golux.com/coar/cgi/">Common Gateway
  478.     Interface RFC project</a>.</p>
  479.  
  480.     <p>When you post a question about a CGI problem that you're
  481.     having, whether to a mailing list, or to a newsgroup, make sure
  482.     you provide enough information about what happened, what you
  483.     expected to happen, and how what actually happened was
  484.     different, what server you're running, what language your CGI
  485.     program was in, and, if possible, the offending code. This will
  486.     make finding your problem much simpler.</p>
  487.  
  488.     <p>Note that questions about CGI problems should <strong>never</strong>
  489.     be posted to the Apache bug database unless you are sure you
  490.     have found a problem in the Apache source code.</p>
  491.   </section>
  492. </manualpage>
  493.  
  494.