home *** CD-ROM | disk | FTP | other *** search
/ Chip 2004 November / CMCD1104.ISO / Software / Complet / Apache / apache_2.0.52-win32-x86-no_ssl.msi / Data.Cab / F278654_details.xml < prev    next >
Extensible Markup Language  |  2004-04-17  |  18KB  |  433 lines

  1. <?xml version='1.0' encoding='UTF-8' ?>
  2. <!DOCTYPE manualpage SYSTEM "../style/manualpage.dtd">
  3. <?xml-stylesheet type="text/xsl" href="../style/manual.en.xsl"?>
  4. <!-- $Revision: 1.2.2.5 $ -->
  5.  
  6. <!--
  7.  Copyright 2002-2004 The Apache Software Foundation
  8.  
  9.  Licensed under the Apache License, Version 2.0 (the "License");
  10.  you may not use this file except in compliance with the License.
  11.  You may obtain a copy of the License at
  12.  
  13.      http://www.apache.org/licenses/LICENSE-2.0
  14.  
  15.  Unless required by applicable law or agreed to in writing, software
  16.  distributed under the License is distributed on an "AS IS" BASIS,
  17.  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  18.  See the License for the specific language governing permissions and
  19.  limitations under the License.
  20. -->
  21.  
  22. <manualpage metafile="details.xml.meta">
  23. <parentdocument href="./">Virtual Hosts</parentdocument>
  24.    <title>An In-Depth Discussion of Virtual Host Matching</title>
  25.  
  26. <summary>
  27.  
  28.     <p>The virtual host code was completely rewritten in
  29.     <strong>Apache 1.3</strong>. This document attempts to explain
  30.     exactly what Apache does when deciding what virtual host to
  31.     serve a hit from. With the help of the new
  32.     <directive module="core">NameVirtualHost</directive>
  33.     directive virtual host configuration should be a lot easier and
  34.     safer than with versions prior to 1.3.</p>
  35.  
  36.     <p>If you just want to <cite>make it work</cite> without
  37.     understanding how, here are <a href="examples.html">some
  38.     examples</a>.</p>
  39.  
  40. </summary>
  41.  
  42. <section id="configparsing"><title>Config File Parsing</title>
  43.  
  44.     <p>There is a <em>main_server</em> which consists of all the
  45.     definitions appearing outside of
  46.     <code><VirtualHost></code> sections. There are virtual
  47.     servers, called <em>vhosts</em>, which are defined by
  48.     <directive type="section" module="core">VirtualHost</directive>
  49.     sections.</p>
  50.  
  51.     <p>The directives
  52.     <directive module="mpm_common">Listen</directive>,
  53.     <directive module="core">ServerName</directive>,
  54.     <directive module="core">ServerPath</directive>,
  55.     and <directive module="core">ServerAlias</directive>
  56.     can appear anywhere within the definition of a server. However,
  57.     each appearance overrides the previous appearance (within that
  58.     server).</p>
  59.  
  60.     <p>The default value of the <code>Listen</code> field for
  61.     main_server is 80. The main_server has no default
  62.     <code>ServerPath</code>, or <code>ServerAlias</code>. The
  63.     default <code>ServerName</code> is deduced from the servers IP
  64.     address.</p>
  65.  
  66.     <p>The main_server Listen directive has two functions.  One
  67.     function is to determine the default network port Apache will
  68.     bind to.  The second function is to specify the port number
  69.     which is used in absolute URIs during redirects.</p>
  70.  
  71.     <p>Unlike the main_server, vhost ports <em>do not</em> affect
  72.     what ports Apache listens for connections on.</p>
  73.  
  74.     <p>Each address appearing in the <code>VirtualHost</code>
  75.     directive can have an optional port. If the port is unspecified
  76.     it defaults to the value of the main_server's most recent
  77.     <code>Listen</code> statement. The special port <code>*</code>
  78.     indicates a wildcard that matches any port. Collectively the
  79.     entire set of addresses (including multiple <code>A</code>
  80.     record results from DNS lookups) are called the vhost's
  81.     <em>address set</em>.</p>
  82.  
  83.     <p>Unless a <directive module="core">NameVirtualHost</directive>
  84.     directive is used for a specific IP address the first vhost
  85.     with that address is treated as an IP-based vhost. The IP
  86.     address can also be the wildcard <code>*</code>.</p>
  87.  
  88.     <p>If name-based vhosts should be used a
  89.     <code>NameVirtualHost</code> directive <em>must</em> appear
  90.     with the IP address set to be used for the name-based vhosts.
  91.     In other words, you must specify the IP address that holds the
  92.     hostname aliases (CNAMEs) for your name-based vhosts via a
  93.     <code>NameVirtualHost</code> directive in your configuration
  94.     file.</p>
  95.  
  96.     <p>Multiple <code>NameVirtualHost</code> directives can be used
  97.     each with a set of <code>VirtualHost</code> directives but only
  98.     one <code>NameVirtualHost</code> directive should be used for
  99.     each specific IP:port pair.</p>
  100.  
  101.     <p>The ordering of <code>NameVirtualHost</code> and
  102.     <code>VirtualHost</code> directives is not important which
  103.     makes the following two examples identical (only the order of
  104.     the <code>VirtualHost</code> directives for <em>one</em>
  105.     address set is important, see below):</p>
  106.  
  107. <table><tr>
  108. <td><example>
  109.   NameVirtualHost 111.22.33.44<br />
  110.   <VirtualHost 111.22.33.44><br />
  111.   # server A<br />
  112.   ...<br />
  113.   </VirtualHost><br />
  114.   <VirtualHost 111.22.33.44><br />
  115.   # server B<br />
  116.   ...<br />
  117.   </VirtualHost><br />
  118.   <br />
  119.   NameVirtualHost 111.22.33.55<br />
  120.   <VirtualHost 111.22.33.55><br />
  121.   # server C<br />
  122.   ...<br />
  123.   </VirtualHost><br />
  124.   <VirtualHost 111.22.33.55><br />
  125.   # server D<br />
  126.   ...<br />
  127.   </VirtualHost>
  128. </example></td>
  129. <td><example>
  130.   <VirtualHost 111.22.33.44><br />
  131.   # server A<br />
  132.   </VirtualHost><br />
  133.   <VirtualHost 111.22.33.55><br />
  134.   # server C<br />
  135.   ...<br />
  136.   </VirtualHost><br />
  137.   <VirtualHost 111.22.33.44><br />
  138.   # server B<br />
  139.   ...<br />
  140.   </VirtualHost><br />
  141.   <VirtualHost 111.22.33.55><br />
  142.   # server D<br />
  143.   ...<br />
  144.   </VirtualHost><br />
  145.   <br />
  146.   NameVirtualHost 111.22.33.44<br />
  147.   NameVirtualHost 111.22.33.55<br />
  148.   <br />
  149. </example></td>
  150. </tr></table>
  151.  
  152.  
  153.     <p>(To aid the readability of your configuration you should
  154.     prefer the left variant.)</p>
  155.  
  156.     <p>After parsing the <code>VirtualHost</code> directive, the
  157.     vhost server is given a default <code>Listen</code> equal to the
  158.     port assigned to the first name in its <code>VirtualHost</code>
  159.     directive.</p>
  160.  
  161.     <p>The complete list of names in the <code>VirtualHost</code>
  162.     directive are treated just like a <code>ServerAlias</code> (but
  163.     are not overridden by any <code>ServerAlias</code> statement)
  164.     if all names resolve to the same address set. Note that
  165.     subsequent <code>Listen</code> statements for this vhost will not
  166.     affect the ports assigned in the address set.</p>
  167.  
  168.     <p>During initialization a list for each IP address is
  169.     generated and inserted into an hash table. If the IP address is
  170.     used in a <code>NameVirtualHost</code> directive the list
  171.     contains all name-based vhosts for the given IP address. If
  172.     there are no vhosts defined for that address the
  173.     <code>NameVirtualHost</code> directive is ignored and an error
  174.     is logged. For an IP-based vhost the list in the hash table is
  175.     empty.</p>
  176.  
  177.     <p>Due to a fast hashing function the overhead of hashing an IP
  178.     address during a request is minimal and almost not existent.
  179.     Additionally the table is optimized for IP addresses which vary
  180.     in the last octet.</p>
  181.  
  182.     <p>For every vhost various default values are set. In
  183.     particular:</p>
  184.  
  185.     <ol>
  186.       <li>If a vhost has no <directive module="core">ServerAdmin</directive>,
  187.       <directive module="core">ResourceConfig</directive>,
  188.       <directive module="core">AccessConfig</directive>,
  189.       <directive module="core">Timeout</directive>,
  190.       <directive module="core">KeepAliveTimeout</directive>,
  191.       <directive module="core">KeepAlive</directive>,
  192.       <directive module="core">MaxKeepAliveRequests</directive>,
  193.       or <directive module="core">SendBufferSize</directive>
  194.       directive then the respective value is inherited from the
  195.       main_server. (That is, inherited from whatever the final
  196.       setting of that value is in the main_server.)</li>
  197.  
  198.       <li>The "lookup defaults" that define the default directory
  199.       permissions for a vhost are merged with those of the
  200.       main_server. This includes any per-directory configuration
  201.       information for any module.</li>
  202.  
  203.       <li>The per-server configs for each module from the
  204.       main_server are merged into the vhost server.</li>
  205.     </ol>
  206.  
  207.     <p>Essentially, the main_server is treated as "defaults" or a
  208.     "base" on which to build each vhost. But the positioning of
  209.     these main_server definitions in the config file is largely
  210.     irrelevant -- the entire config of the main_server has been
  211.     parsed when this final merging occurs. So even if a main_server
  212.     definition appears after a vhost definition it might affect the
  213.     vhost definition.</p>
  214.  
  215.     <p>If the main_server has no <code>ServerName</code> at this
  216.     point, then the hostname of the machine that httpd is running
  217.     on is used instead. We will call the <em>main_server address
  218.     set</em> those IP addresses returned by a DNS lookup on the
  219.     <code>ServerName</code> of the main_server.</p>
  220.  
  221.     <p>For any undefined <code>ServerName</code> fields, a
  222.     name-based vhost defaults to the address given first in the
  223.     <code>VirtualHost</code> statement defining the vhost.</p>
  224.  
  225.     <p>Any vhost that includes the magic <code>_default_</code>
  226.     wildcard is given the same <code>ServerName</code> as the
  227.     main_server.</p>
  228.  
  229. </section>
  230.  
  231. <section id="hostmatching"><title>Virtual Host Matching</title>
  232.  
  233.     <p>The server determines which vhost to use for a request as
  234.     follows:</p>
  235.  
  236.     <section id="hashtable"><title>Hash table lookup</title>
  237.  
  238.     <p>When the connection is first made by a client, the IP
  239.     address to which the client connected is looked up in the
  240.     internal IP hash table.</p>
  241.  
  242.     <p>If the lookup fails (the IP address wasn't found) the
  243.     request is served from the <code>_default_</code> vhost if
  244.     there is such a vhost for the port to which the client sent the
  245.     request. If there is no matching <code>_default_</code> vhost
  246.     the request is served from the main_server.</p>
  247.  
  248.     <p>If the IP address is not found in the hash table then the
  249.     match against the port number may also result in an entry
  250.     corresponding to a <code>NameVirtualHost *</code>, which is
  251.     subsequently handled like other name-based vhosts.</p>
  252.  
  253.     <p>If the lookup succeeded (a corresponding list for the IP
  254.     address was found) the next step is to decide if we have to
  255.     deal with an IP-based or a name-base vhost.</p>
  256.  
  257.     </section>
  258.  
  259.     <section id="ipbased"><title>IP-based vhost</title>
  260.  
  261.     <p>If the entry we found has an empty name list then we have
  262.     found an IP-based vhost, no further actions are performed and
  263.     the request is served from that vhost.</p>
  264.  
  265.     </section>
  266.  
  267.     <section id="namebased"><title>Name-based vhost</title>
  268.  
  269.     <p>If the entry corresponds to a name-based vhost the name list
  270.     contains one or more vhost structures. This list contains the
  271.     vhosts in the same order as the <code>VirtualHost</code>
  272.     directives appear in the config file.</p>
  273.  
  274.     <p>The first vhost on this list (the first vhost in the config
  275.     file with the specified IP address) has the highest priority
  276.     and catches any request to an unknown server name or a request
  277.     without a <code>Host:</code> header field.</p>
  278.  
  279.     <p>If the client provided a <code>Host:</code> header field the
  280.     list is searched for a matching vhost and the first hit on a
  281.     <code>ServerName</code> or <code>ServerAlias</code> is taken
  282.     and the request is served from that vhost. A <code>Host:</code>
  283.     header field can contain a port number, but Apache always
  284.     matches against the real port to which the client sent the
  285.     request.</p>
  286.  
  287.     <p>If the client submitted a HTTP/1.0 request without
  288.     <code>Host:</code> header field we don't know to what server
  289.     the client tried to connect and any existing
  290.     <code>ServerPath</code> is matched against the URI from the
  291.     request. The first matching path on the list is used and the
  292.     request is served from that vhost.</p>
  293.  
  294.     <p>If no matching vhost could be found the request is served
  295.     from the first vhost with a matching port number that is on the
  296.     list for the IP to which the client connected (as already
  297.     mentioned before).</p>
  298.  
  299.     </section>
  300.  
  301.     <section id="persistent"><title>Persistent connections</title>
  302.  
  303.     <p>The IP lookup described above is only done <em>once</em> for a
  304.     particular TCP/IP session while the name lookup is done on
  305.     <em>every</em> request during a KeepAlive/persistent
  306.     connection. In other words a client may request pages from
  307.     different name-based vhosts during a single persistent
  308.     connection.</p>
  309.  
  310.     </section>
  311.  
  312.     <section id="absoluteURI"><title>Absolute URI</title>
  313.  
  314.     <p>If the URI from the request is an absolute URI, and its
  315.     hostname and port match the main server or one of the
  316.     configured virtual hosts <em>and</em> match the address and
  317.     port to which the client sent the request, then the
  318.     scheme/hostname/port prefix is stripped off and the remaining
  319.     relative URI is served by the corresponding main server or
  320.     virtual host. If it does not match, then the URI remains
  321.     untouched and the request is taken to be a proxy request.</p>
  322. </section>
  323.  
  324. <section id="observations"><title>Observations</title>
  325.  
  326.     <ul>
  327.       <li>A name-based vhost can never interfere with an IP-base
  328.       vhost and vice versa. IP-based vhosts can only be reached
  329.       through an IP address of its own address set and never
  330.       through any other address. The same applies to name-based
  331.       vhosts, they can only be reached through an IP address of the
  332.       corresponding address set which must be defined with a
  333.       <code>NameVirtualHost</code> directive.</li>
  334.  
  335.       <li><code>ServerAlias</code> and <code>ServerPath</code>
  336.       checks are never performed for an IP-based vhost.</li>
  337.  
  338.       <li>The order of name-/IP-based, the <code>_default_</code>
  339.       vhost and the <code>NameVirtualHost</code> directive within
  340.       the config file is not important. Only the ordering of
  341.       name-based vhosts for a specific address set is significant.
  342.       The one name-based vhosts that comes first in the
  343.       configuration file has the highest priority for its
  344.       corresponding address set.</li>
  345.  
  346.       <li>For security reasons the port number given in a
  347.       <code>Host:</code> header field is never used during the
  348.       matching process. Apache always uses the real port to which
  349.       the client sent the request.</li>
  350.  
  351.       <li>If a <code>ServerPath</code> directive exists which is a
  352.       prefix of another <code>ServerPath</code> directive that
  353.       appears later in the configuration file, then the former will
  354.       always be matched and the latter will never be matched. (That
  355.       is assuming that no <code>Host:</code> header field was
  356.       available to disambiguate the two.)</li>
  357.  
  358.       <li>If two IP-based vhosts have an address in common, the
  359.       vhost appearing first in the config file is always matched.
  360.       Such a thing might happen inadvertently. The server will give
  361.       a warning in the error logfile when it detects this.</li>
  362.  
  363.       <li>A <code>_default_</code> vhost catches a request only if
  364.       there is no other vhost with a matching IP address
  365.       <em>and</em> a matching port number for the request. The
  366.       request is only caught if the port number to which the client
  367.       sent the request matches the port number of your
  368.       <code>_default_</code> vhost which is your standard
  369.       <code>Listen</code> by default. A wildcard port can be
  370.       specified (<em>i.e.</em>, <code>_default_:*</code>) to catch
  371.       requests to any available port. This also applies to
  372.       <code>NameVirtualHost *</code> vhosts.</li>
  373.  
  374.       <li>The main_server is only used to serve a request if the IP
  375.       address and port number to which the client connected is
  376.       unspecified and does not match any other vhost (including a
  377.       <code>_default_</code> vhost). In other words the main_server
  378.       only catches a request for an unspecified address/port
  379.       combination (unless there is a <code>_default_</code> vhost
  380.       which matches that port).</li>
  381.  
  382.       <li>A <code>_default_</code> vhost or the main_server is
  383.       <em>never</em> matched for a request with an unknown or
  384.       missing <code>Host:</code> header field if the client
  385.       connected to an address (and port) which is used for
  386.       name-based vhosts, <em>e.g.</em>, in a
  387.       <code>NameVirtualHost</code> directive.</li>
  388.  
  389.       <li>You should never specify DNS names in
  390.       <code>VirtualHost</code> directives because it will force
  391.       your server to rely on DNS to boot. Furthermore it poses a
  392.       security threat if you do not control the DNS for all the
  393.       domains listed. There's <a href="../dns-caveats.html">more
  394.       information</a> available on this and the next two
  395.       topics.</li>
  396.  
  397.       <li><code>ServerName</code> should always be set for each
  398.       vhost. Otherwise A DNS lookup is required for each
  399.       vhost.</li>
  400.       </ul>
  401.       </section>
  402.  
  403. </section>
  404.  
  405. <section id="tips"><title>Tips</title>
  406.  
  407.     <p>In addition to the tips on the <a
  408.     href="../dns-caveats.html#tips">DNS Issues</a> page, here are
  409.     some further tips:</p>
  410.  
  411.     <ul>
  412.       <li>Place all main_server definitions before any
  413.       <code>VirtualHost</code> definitions. (This is to aid the
  414.       readability of the configuration -- the post-config merging
  415.       process makes it non-obvious that definitions mixed in around
  416.       virtual hosts might affect all virtual hosts.)</li>
  417.  
  418.       <li>Group corresponding <code>NameVirtualHost</code> and
  419.       <code>VirtualHost</code> definitions in your configuration to
  420.       ensure better readability.</li>
  421.  
  422.       <li>Avoid <code>ServerPaths</code> which are prefixes of
  423.       other <code>ServerPaths</code>. If you cannot avoid this then
  424.       you have to ensure that the longer (more specific) prefix
  425.       vhost appears earlier in the configuration file than the
  426.       shorter (less specific) prefix (<em>i.e.</em>, "ServerPath
  427.       /abc" should appear after "ServerPath /abc/def").</li>
  428.     </ul>
  429.  
  430. </section>
  431. </manualpage>
  432.  
  433.