home *** CD-ROM | disk | FTP | other *** search
/ PC World 2003 May / PCWorld_2003-05_cd.bin / Komunik / apache / apache_2.0.45-win32-x86-no_ssl.msi / Data.Cab / F232667_dso.xml < prev    next >
Extensible Markup Language  |  2002-11-02  |  13KB  |  295 lines

  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <!DOCTYPE manualpage SYSTEM "./style/manualpage.dtd">
  3. <?xml-stylesheet type="text/xsl" href="./style/manual.en.xsl"?>
  4.  
  5. <manualpage>
  6.   <relativepath href="."/>
  7.  
  8.   <title>Dynamic Shared Object (DSO) Support</title>
  9.  
  10.   <summary>
  11.     <p>The Apache HTTP Server is a modular program where the
  12.     administrator can choose the functionality to include in the
  13.     server by selecting a set of modules. The modules can be
  14.     statically compiled into the <code>httpd</code> binary when the
  15.     server is built. Alternatively, modules can be compiled as
  16.     Dynamic Shared Objects (DSOs) that exist separately from the
  17.     main <code>httpd</code> binary file. DSO modules may be
  18.     compiled at the time the server is built, or they may be
  19.     compiled and added at a later time using the Apache Extension
  20.     Tool (<a href="programs/apxs.html">apxs</a>).</p>
  21.  
  22.     <p>This document describes how to use DSO modules as well as
  23.     the theory behind their use.</p>
  24.   </summary>
  25.  
  26.  
  27. <section id="implementation"><title>Implementation</title>
  28.  
  29. <related>
  30. <modulelist>
  31. <module>mod_so</module>
  32. </modulelist>
  33. <directivelist>
  34. <directive module="mod_so">LoadModule</directive>
  35. </directivelist>
  36. </related>
  37.  
  38.     <p>The DSO support for loading individual Apache modules is based
  39.     on a module named <module>mod_so</module> which must be statically
  40.     compiled into the Apache core. It is the only module besides
  41.     <module>core</module> which cannot be put into a DSO
  42.     itself. Practically all other distributed Apache modules can then
  43.     be placed into a DSO by individually enabling the DSO build for
  44.     them via <code>configure</code>'s
  45.     <code>--enable-<em>module</em>=shared</code> option as discussed
  46.     in the <a href="install.html">install documentation</a>. After a
  47.     module is compiled into a DSO named <code>mod_foo.so</code> you
  48.     can use <module>mod_so</module>'s <directive
  49.     module="mod_so">LoadModule</directive> command in your
  50.     <code>httpd.conf</code> file to load this module at server startup
  51.     or restart.</p>
  52.  
  53.     <p>To simplify this creation of DSO files for Apache modules
  54.     (especially for third-party modules) a new support program
  55.     named <a href="programs/apxs.html">apxs</a> (<em>APache
  56.     eXtenSion</em>) is available. It can be used to build DSO based
  57.     modules <em>outside of</em> the Apache source tree. The idea is
  58.     simple: When installing Apache the <code>configure</code>'s
  59.     <code>make install</code> procedure installs the Apache C
  60.     header files and puts the platform-dependent compiler and
  61.     linker flags for building DSO files into the <code>apxs</code>
  62.     program. This way the user can use <code>apxs</code> to compile
  63.     his Apache module sources without the Apache distribution
  64.     source tree and without having to fiddle with the
  65.     platform-dependent compiler and linker flags for DSO
  66.     support.</p>
  67. </section>
  68.  
  69. <section id="usage"><title>Usage Summary</title>
  70.  
  71.     <p>To give you an overview of the DSO features of Apache 2.0,
  72.     here is a short and concise summary:</p>
  73.  
  74.     <ol>
  75.       <li>
  76.         Build and install a <em>distributed</em> Apache module, say
  77.         <code>mod_foo.c</code>, into its own DSO
  78.         <code>mod_foo.so</code>: 
  79.  
  80. <example>
  81. $ ./configure --prefix=/path/to/install --enable-foo=shared<br />
  82. $ make install
  83. </example>
  84.       </li>
  85.  
  86.       <li>
  87.         Build and install a <em>third-party</em> Apache module, say
  88.         <code>mod_foo.c</code>, into its own DSO
  89.         <code>mod_foo.so</code>: 
  90.  
  91. <example>
  92. $ ./configure --add-module=module_type:/path/to/3rdparty/mod_foo.c --enable-foo=shared<br />
  93. $ make install
  94. </example>
  95.       </li>
  96.  
  97.       <li>
  98.         Configure Apache for <em>later installation</em> of shared
  99.         modules: 
  100.  
  101. <example>
  102. $ ./configure --enable-so<br />
  103. $ make install
  104. </example>
  105.       </li>
  106.  
  107.       <li>
  108.         Build and install a <em>third-party</em> Apache module, say
  109.         <code>mod_foo.c</code>, into its own DSO
  110.         <code>mod_foo.so</code> <em>outside of</em> the Apache
  111.         source tree using <a href="programs/apxs.html">apxs</a>: 
  112.  
  113. <example>
  114. $ cd /path/to/3rdparty<br />
  115. $ apxs -c mod_foo.c<br />
  116. $ apxs -i -a -n foo mod_foo.la
  117. </example>
  118.       </li>
  119.     </ol>
  120.  
  121.     <p>In all cases, once the shared module is compiled, you must
  122.     use a <directive module="mod_so">LoadModule</directive>
  123.     directive in <code>httpd.conf</code> to tell Apache to activate
  124.     the module.</p>
  125. </section>
  126.  
  127. <section id="background"><title>Background</title>
  128.  
  129.     <p>On modern Unix derivatives there exists a nifty mechanism
  130.     usually called dynamic linking/loading of <em>Dynamic Shared
  131.     Objects</em> (DSO) which provides a way to build a piece of
  132.     program code in a special format for loading it at run-time
  133.     into the address space of an executable program.</p>
  134.  
  135.     <p>This loading can usually be done in two ways: Automatically
  136.     by a system program called <code>ld.so</code> when an
  137.     executable program is started or manually from within the
  138.     executing program via a programmatic system interface to the
  139.     Unix loader through the system calls
  140.     <code>dlopen()/dlsym()</code>.</p>
  141.  
  142.     <p>In the first way the DSO's are usually called <em>shared
  143.     libraries</em> or <em>DSO libraries</em> and named
  144.     <code>libfoo.so</code> or <code>libfoo.so.1.2</code>. They
  145.     reside in a system directory (usually <code>/usr/lib</code>)
  146.     and the link to the executable program is established at
  147.     build-time by specifying <code>-lfoo</code> to the linker
  148.     command. This hard-codes library references into the executable
  149.     program file so that at start-time the Unix loader is able to
  150.     locate <code>libfoo.so</code> in <code>/usr/lib</code>, in
  151.     paths hard-coded via linker-options like <code>-R</code> or in
  152.     paths configured via the environment variable
  153.     <code>LD_LIBRARY_PATH</code>. It then resolves any (yet
  154.     unresolved) symbols in the executable program which are
  155.     available in the DSO.</p>
  156.  
  157.     <p>Symbols in the executable program are usually not referenced
  158.     by the DSO (because it's a reusable library of general code)
  159.     and hence no further resolving has to be done. The executable
  160.     program has no need to do anything on its own to use the
  161.     symbols from the DSO because the complete resolving is done by
  162.     the Unix loader. (In fact, the code to invoke
  163.     <code>ld.so</code> is part of the run-time startup code which
  164.     is linked into every executable program which has been bound
  165.     non-static). The advantage of dynamic loading of common library
  166.     code is obvious: the library code needs to be stored only once,
  167.     in a system library like <code>libc.so</code>, saving disk
  168.     space for every program.</p>
  169.  
  170.     <p>In the second way the DSO's are usually called <em>shared
  171.     objects</em> or <em>DSO files</em> and can be named with an
  172.     arbitrary extension (although the canonical name is
  173.     <code>foo.so</code>). These files usually stay inside a
  174.     program-specific directory and there is no automatically
  175.     established link to the executable program where they are used.
  176.     Instead the executable program manually loads the DSO at
  177.     run-time into its address space via <code>dlopen()</code>. At
  178.     this time no resolving of symbols from the DSO for the
  179.     executable program is done. But instead the Unix loader
  180.     automatically resolves any (yet unresolved) symbols in the DSO
  181.     from the set of symbols exported by the executable program and
  182.     its already loaded DSO libraries (especially all symbols from
  183.     the ubiquitous <code>libc.so</code>). This way the DSO gets
  184.     knowledge of the executable program's symbol set as if it had
  185.     been statically linked with it in the first place.</p>
  186.  
  187.     <p>Finally, to take advantage of the DSO's API the executable
  188.     program has to resolve particular symbols from the DSO via
  189.     <code>dlsym()</code> for later use inside dispatch tables
  190.     <em>etc.</em> In other words: The executable program has to
  191.     manually resolve every symbol it needs to be able to use it.
  192.     The advantage of such a mechanism is that optional program
  193.     parts need not be loaded (and thus do not spend memory) until
  194.     they are needed by the program in question. When required,
  195.     these program parts can be loaded dynamically to extend the
  196.     base program's functionality.</p>
  197.  
  198.     <p>Although this DSO mechanism sounds straightforward there is
  199.     at least one difficult step here: The resolving of symbols from
  200.     the executable program for the DSO when using a DSO to extend a
  201.     program (the second way). Why? Because "reverse resolving" DSO
  202.     symbols from the executable program's symbol set is against the
  203.     library design (where the library has no knowledge about the
  204.     programs it is used by) and is neither available under all
  205.     platforms nor standardized. In practice the executable
  206.     program's global symbols are often not re-exported and thus not
  207.     available for use in a DSO. Finding a way to force the linker
  208.     to export all global symbols is the main problem one has to
  209.     solve when using DSO for extending a program at run-time.</p>
  210.  
  211.     <p>The shared library approach is the typical one, because it
  212.     is what the DSO mechanism was designed for, hence it is used
  213.     for nearly all types of libraries the operating system
  214.     provides. On the other hand using shared objects for extending
  215.     a program is not used by a lot of programs.</p>
  216.  
  217.     <p>As of 1998 there are only a few software packages available
  218.     which use the DSO mechanism to actually extend their
  219.     functionality at run-time: Perl 5 (via its XS mechanism and the
  220.     DynaLoader module), Netscape Server, <em>etc.</em> Starting
  221.     with version 1.3, Apache joined the crew, because Apache
  222.     already uses a module concept to extend its functionality and
  223.     internally uses a dispatch-list-based approach to link external
  224.     modules into the Apache core functionality. So, Apache is
  225.     really predestined for using DSO to load its modules at
  226.     run-time.</p>
  227. </section>
  228.  
  229. <section id="advantages"><title>Advantages and Disadvantages</title>
  230.  
  231.     <p>The above DSO based features have the following
  232.     advantages:</p>
  233.  
  234.     <ul>
  235.       <li>The server package is more flexible at run-time because
  236.       the actual server process can be assembled at run-time via
  237.       <directive module="mod_so">LoadModule</directive>
  238.       <code>httpd.conf</code> configuration commands instead of
  239.       <code>configure</code> options at build-time. For instance
  240.       this way one is able to run different server instances
  241.       (standard & SSL version, minimalistic & powered up
  242.       version [mod_perl, PHP3], <em>etc.</em>) with only one Apache
  243.       installation.</li>
  244.  
  245.       <li>The server package can be easily extended with
  246.       third-party modules even after installation. This is at least
  247.       a great benefit for vendor package maintainers who can create
  248.       a Apache core package and additional packages containing
  249.       extensions like PHP3, mod_perl, mod_fastcgi,
  250.       <em>etc.</em></li>
  251.  
  252.       <li>Easier Apache module prototyping because with the
  253.       DSO/<code>apxs</code> pair you can both work outside the
  254.       Apache source tree and only need an <code>apxs -i</code>
  255.       command followed by an <code>apachectl restart</code> to
  256.       bring a new version of your currently developed module into
  257.       the running Apache server.</li>
  258.     </ul>
  259.  
  260.     <p>DSO has the following disadvantages:</p>
  261.  
  262.     <ul>
  263.       <li>The DSO mechanism cannot be used on every platform
  264.       because not all operating systems support dynamic loading of
  265.       code into the address space of a program.</li>
  266.  
  267.       <li>The server is approximately 20% slower at startup time
  268.       because of the symbol resolving overhead the Unix loader now
  269.       has to do.</li>
  270.  
  271.       <li>The server is approximately 5% slower at execution time
  272.       under some platforms because position independent code (PIC)
  273.       sometimes needs complicated assembler tricks for relative
  274.       addressing which are not necessarily as fast as absolute
  275.       addressing.</li>
  276.  
  277.       <li>Because DSO modules cannot be linked against other
  278.       DSO-based libraries (<code>ld -lfoo</code>) on all platforms
  279.       (for instance a.out-based platforms usually don't provide
  280.       this functionality while ELF-based platforms do) you cannot
  281.       use the DSO mechanism for all types of modules. Or in other
  282.       words, modules compiled as DSO files are restricted to only
  283.       use symbols from the Apache core, from the C library
  284.       (<code>libc</code>) and all other dynamic or static libraries
  285.       used by the Apache core, or from static library archives
  286.       (<code>libfoo.a</code>) containing position independent code.
  287.       The only chances to use other code is to either make sure the
  288.       Apache core itself already contains a reference to it or
  289.       loading the code yourself via <code>dlopen()</code>.</li>
  290.     </ul>
  291.  
  292. </section>
  293.  
  294. </manualpage>
  295.