home *** CD-ROM | disk | FTP | other *** search
/ Chip 2000 May / Chip_2000-05_cd1.bin / zkuste / Perl / ActivePerl-5.6.0.613.msi / 䆊䌷䈹䈙䏵-䞅䞆䞀㡆䞃䄦䠥 / _f625cdc49f1832207810b4bb5458037a < prev    next >
Text File  |  2000-03-15  |  16KB  |  541 lines

  1. #
  2. # $Id: Headers.pm,v 1.36 1998/04/10 14:51:22 aas Exp $
  3.  
  4. package HTTP::Headers;
  5.  
  6. =head1 NAME
  7.  
  8. HTTP::Headers - Class encapsulating HTTP Message headers
  9.  
  10. =head1 SYNOPSIS
  11.  
  12.  require HTTP::Headers;
  13.  $h = new HTTP::Headers;
  14.  
  15. =head1 DESCRIPTION
  16.  
  17. The C<HTTP::Headers> class encapsulates HTTP-style message headers.
  18. The headers consist of attribute-value pairs, which may be repeated,
  19. and which are printed in a particular order.
  20.  
  21. Instances of this class are usually created as member variables of the
  22. C<HTTP::Request> and C<HTTP::Response> classes, internal to the
  23. library.
  24.  
  25. The following methods are available:
  26.  
  27. =over 4
  28.  
  29. =cut
  30.  
  31. use strict;
  32. use vars qw($VERSION $TRANSLATE_UNDERSCORE);
  33. $VERSION = sprintf("%d.%02d", q$Revision: 1.36 $ =~ /(\d+)\.(\d+)/);
  34.  
  35. use Carp ();
  36.  
  37. # Could not use the AutoLoader becase several of the method names are
  38. # not unique in the first 8 characters.
  39. #use SelfLoader;
  40.  
  41.  
  42. # "Good Practice" order of HTTP message headers:
  43. #    - General-Headers
  44. #    - Request-Headers
  45. #    - Response-Headers
  46. #    - Entity-Headers
  47. # (From draft-ietf-http-v11-spec-rev-01, Nov 21, 1997)
  48.  
  49. my @header_order = qw(
  50.    Cache-Control Connection Date Pragma Transfer-Encoding Upgrade Trailer Via
  51.  
  52.    Accept Accept-Charset Accept-Encoding Accept-Language
  53.    Authorization Expect From Host
  54.    If-Modified-Since If-Match If-None-Match If-Range If-Unmodified-Since
  55.    Max-Forwards Proxy-Authorization Range Referer TE User-Agent
  56.  
  57.    Accept-Ranges Age Location Proxy-Authenticate Retry-After Server Vary
  58.    Warning WWW-Authenticate
  59.  
  60.    Allow Content-Base Content-Encoding Content-Language Content-Length
  61.    Content-Location Content-MD5 Content-Range Content-Type
  62.    ETag Expires Last-Modified
  63. );
  64.  
  65. # Make alternative representations of @header_order.  This is used
  66. # for sorting and case matching.
  67. my $i = 0;
  68. my %header_order;
  69. my %standard_case;
  70. for (@header_order) {
  71.     my $lc = lc $_;
  72.     $header_order{$lc} = $i++;
  73.     $standard_case{$lc} = $_;
  74. }
  75.  
  76. $TRANSLATE_UNDERSCORE = 1 unless defined $TRANSLATE_UNDERSCORE;
  77.  
  78.  
  79.  
  80. =item $h = new HTTP::Headers
  81.  
  82. Constructs a new C<HTTP::Headers> object.  You might pass some initial
  83. attribute-value pairs as parameters to the constructor.  I<E.g.>:
  84.  
  85.  $h = new HTTP::Headers
  86.      Date         => 'Thu, 03 Feb 1994 00:00:00 GMT',
  87.      Content_Type => 'text/html; version=3.2',
  88.      Content_Base => 'http://www.sn.no/';
  89.  
  90. =cut
  91.  
  92. sub new
  93. {
  94.     my($class) = shift;
  95.     my $self = bless {}, $class;
  96.     $self->header(@_); # set up initial headers
  97.     $self;
  98. }
  99.  
  100.  
  101. =item $h->header($field [=> $value],...)
  102.  
  103. Get or set the value of a header.  The header field name is not case
  104. sensitive.  To make the life easier for perl users who wants to avoid
  105. quoting before the => operator, you can use '_' as a synonym for '-'
  106. in header names (this behaviour can be suppressed by setting
  107. $HTTP::Headers::TRANSLATE_UNDERSCORE to a FALSE value).
  108.  
  109. The header() method accepts multiple ($field => $value) pairs, so you
  110. can update several fields with a single invocation.
  111.  
  112. The optional $value argument may be a scalar or a reference to a list
  113. of scalars. If the $value argument is undefined or not given, then the
  114. header is not modified.
  115.  
  116. The old value of the last of the $field values is returned.
  117. Multi-valued fields will be concatenated with "," as separator in
  118. scalar context.
  119.  
  120.  $header->header(MIME_Version => '1.0',
  121.          User_Agent   => 'My-Web-Client/0.01');
  122.  $header->header(Accept => "text/html, text/plain, image/*");
  123.  $header->header(Accept => [qw(text/html text/plain image/*)]);
  124.  @accepts = $header->header('Accept');
  125.  
  126. =cut
  127.  
  128. sub header
  129. {
  130.     my $self = shift;
  131.     my($field, $val, @old);
  132.     while (($field, $val) = splice(@_, 0, 2)) {
  133.     @old = $self->_header($field, $val);
  134.     }
  135.     return @old if wantarray;
  136.     return $old[0] if @old <= 1;
  137.     join(", ", @old);
  138. }
  139.  
  140. sub _header
  141. {
  142.     my($self, $field, $val, $push) = @_;
  143.     $field =~ tr/_/-/ if $TRANSLATE_UNDERSCORE;
  144.  
  145.     # $push is only used interally sub push_header
  146.     Carp::croak('Need a field name') unless length($field);
  147.  
  148.     my $lc_field = lc $field;
  149.     unless(defined $standard_case{$lc_field}) {
  150.     # generate a %stadard_case entry for this field
  151.     $field =~ s/\b(\w)/\u$1/g;
  152.     $standard_case{$lc_field} = $field;
  153.     }
  154.  
  155.     my $h = $self->{$lc_field};
  156.     my @old = ref($h) ? @$h : (defined($h) ? ($h) : ());
  157.  
  158.     if (defined $val) {
  159.     my @new = $push ? @old : ();
  160.     if (!ref($val)) {
  161.         push(@new, $val);
  162.     } elsif (ref($val) eq 'ARRAY') {
  163.         push(@new, @$val);
  164.     } else {
  165.         Carp::croak("Unexpected field value $val");
  166.     }
  167.     $self->{$lc_field} = @new > 1 ? \@new : $new[0];
  168.     }
  169.     @old;
  170. }
  171.  
  172.  
  173. # Compare function which makes it easy to sort headers in the
  174. # recommended "Good Practice" order.
  175. sub _header_cmp
  176. {
  177.     # Unknown headers are assign a large value so that they are
  178.     # sorted last.  This also helps avoiding a warning from -w
  179.     # about comparing undefined values.
  180.     $header_order{$a} = 999 unless defined $header_order{$a};
  181.     $header_order{$b} = 999 unless defined $header_order{$b};
  182.  
  183.     $header_order{$a} <=> $header_order{$b} || $a cmp $b;
  184. }
  185.  
  186.  
  187. =item $h->scan(\&doit)
  188.  
  189. Apply a subroutine to each header in turn.  The callback routine is
  190. called with two parameters; the name of the field and a single value.
  191. If the header has more than one value, then the routine is called once
  192. for each value.  The field name passed to the callback routine has
  193. case as suggested by HTTP Spec, and the headers will be visited in the
  194. recommended "Good Practice" order.
  195.  
  196. =cut
  197.  
  198. sub scan
  199. {
  200.     my($self, $sub) = @_;
  201.     my $key;
  202.     foreach $key (sort _header_cmp keys %$self) {
  203.         next if $key =~ /^_/;
  204.     my $vals = $self->{$key};
  205.     if (ref($vals)) {
  206.         my $val;
  207.         for $val (@$vals) {
  208.         &$sub($standard_case{$key} || $key, $val);
  209.         }
  210.     } else {
  211.         &$sub($standard_case{$key} || $key, $vals);
  212.     }
  213.     }
  214. }
  215.  
  216.  
  217. =item $h->as_string([$endl])
  218.  
  219. Return the header fields as a formatted MIME header.  Since it
  220. internally uses the C<scan()> method to build the string, the result
  221. will use case as suggested by HTTP Spec, and it will follow
  222. recommended "Good Practice" of ordering the header fieds.  Long header
  223. values are not folded. 
  224.  
  225. The optional parameter specifies the line ending sequence to use.  The
  226. default is C<"\n">.  Embedded "\n" characters in the header will be
  227. substitued with this line ending sequence.
  228.  
  229. =cut
  230.  
  231. sub as_string
  232. {
  233.     my($self, $endl) = @_;
  234.     $endl = "\n" unless defined $endl;
  235.  
  236.     my @result = ();
  237.     $self->scan(sub {
  238.     my($field, $val) = @_;
  239.     if ($val =~ /\n/) {
  240.         # must handle header values with embedded newlines with care
  241.         $val =~ s/\s+$//;          # trailing newlines and space must go
  242.         $val =~ s/\n\n+/\n/g;      # no empty lines
  243.         $val =~ s/\n([^\040\t])/\n $1/g;  # intial space for continuation
  244.         $val =~ s/\n/$endl/g;      # substitute with requested line ending
  245.     }
  246.     push(@result, "$field: $val");
  247.     });
  248.  
  249.     join($endl, @result, '');
  250. }
  251.  
  252.  
  253. # The remaining functions should autoloaded only when needed
  254.  
  255. # A bug in 5.002gamma makes it risky to have POD text inside the
  256. # autoloaded section of the code, so we keep the documentation before
  257. # the __DATA__ token.
  258.  
  259. =item $h->push_header($field, $val)
  260.  
  261. Add a new field value of the specified header.  The header field name
  262. is not case sensitive.  The field need not already have a
  263. value. Previous values for the same field are retained.  The argument
  264. may be a scalar or a reference to a list of scalars.
  265.  
  266.  $header->push_header(Accept => 'image/jpeg');
  267.  
  268. =item $h->remove_header($field,...)
  269.  
  270. This function removes the headers with the specified names.
  271.  
  272. =item $h->clone
  273.  
  274. Returns a copy of this HTTP::Headers object.
  275.  
  276. =back
  277.  
  278. =head1 CONVENIENCE METHODS
  279.  
  280. The most frequently used headers can also be accessed through the
  281. following convenience methods.  These methods can both be used to read
  282. and to set the value of a header.  The header value is set if you pass
  283. an argument to the method.  The old header value is always returned.
  284.  
  285. Methods that deal with dates/times always convert their value to system
  286. time (seconds since Jan 1, 1970) and they also expect this kind of
  287. value when the header value is set.
  288.  
  289. =over 4
  290.  
  291. =item $h->date
  292.  
  293. This header represents the date and time at which the message was
  294. originated. I<E.g.>:
  295.  
  296.   $h->date(time);  # set current date
  297.  
  298. =item $h->expires
  299.  
  300. This header gives the date and time after which the entity should be
  301. considered stale.
  302.  
  303. =item $h->if_modified_since
  304.  
  305. =item $h->if_unmodified_since
  306.  
  307. This header is used to make a request conditional.  If the requested
  308. resource has (not) been modified since the time specified in this field,
  309. then the server will return a C<"304 Not Modified"> response instead of
  310. the document itself.
  311.  
  312. =item $h->last_modified
  313.  
  314. This header indicates the date and time at which the resource was last
  315. modified. I<E.g.>:
  316.  
  317.   # check if document is more than 1 hour old
  318.   if ($h->last_modified < time - 60*60) {
  319.     ...
  320.   }
  321.  
  322. =item $h->content_type
  323.  
  324. The Content-Type header field indicates the media type of the message
  325. content. I<E.g.>:
  326.  
  327.   $h->content_type('text/html');
  328.  
  329. The value returned will be converted to lower case, and potential
  330. parameters will be chopped off and returned as a separate value if in
  331. an array context.  This makes it safe to do the following:
  332.  
  333.   if ($h->content_type eq 'text/html') {
  334.      # we enter this place even if the real header value happens to
  335.      # be 'TEXT/HTML; version=3.0'
  336.      ...
  337.   }
  338.  
  339. =item $h->content_encoding
  340.  
  341. The Content-Encoding header field is used as a modifier to the
  342. media type.  When present, its value indicates what additional
  343. encoding mechanism has been applied to the resource.
  344.  
  345. =item $h->content_length
  346.  
  347. A decimal number indicating the size in bytes of the message content.
  348.  
  349. =item $h->content_language
  350.  
  351. The natural language(s) of the intended audience for the message
  352. content.  The value is one or more language tags as defined by RFC
  353. 1766.  Eg. "no" for Norwegian and "en-US" for US-English.
  354.  
  355. =item $h->title
  356.  
  357. The title of the document.  In libwww-perl this header will be
  358. initialized automatically from the E<lt>TITLE>...E<lt>/TITLE> element
  359. of HTML documents.  I<This header is no longer part of the HTTP
  360. standard.>
  361.  
  362. =item $h->user_agent
  363.  
  364. This header field is used in request messages and contains information
  365. about the user agent originating the request.  I<E.g.>:
  366.  
  367.   $h->user_agent('Mozilla/1.2');
  368.  
  369. =item $h->server
  370.  
  371. The server header field contains information about the software being
  372. used by the originating server program handling the request.
  373.  
  374. =item $h->from
  375.  
  376. This header should contain an Internet e-mail address for the human
  377. user who controls the requesting user agent.  The address should be
  378. machine-usable, as defined by RFC822.  E.g.:
  379.  
  380.   $h->from('Gisle Aas <aas@sn.no>');
  381.  
  382. =item $h->referer
  383.  
  384. Used to specify the address (URI) of the document from which the
  385. requested resouce address was obtained.
  386.  
  387. =item $h->www_authenticate
  388.  
  389. This header must be included as part of a "401 Unauthorized" response.
  390. The field value consist of a challenge that indicates the
  391. authentication scheme and parameters applicable to the requested URI.
  392.  
  393. =item $h->proxy_authenticate
  394.  
  395. This header must be included in a "407 Proxy Authentication Required"
  396. response.
  397.  
  398. =item $h->authorization
  399.  
  400. =item $h->proxy_authorization
  401.  
  402. A user agent that wishes to authenticate itself with a server or a
  403. proxy, may do so by including these headers.
  404.  
  405. =item $h->authorization_basic
  406.  
  407. This method is used to get or set an authorization header that use the
  408. "Basic Authentication Scheme".  In array context it will return two
  409. values; the user name and the password.  In scalar context it will
  410. return I<"uname:password"> as a single string value.
  411.  
  412. When used to set the header value, it expects two arguments.  I<E.g.>:
  413.  
  414.   $h->authorization_basic($uname, $password);
  415.  
  416. The method will croak if the $uname contains a colon ':'.
  417.  
  418. =item $h->proxy_authorization_basic
  419.  
  420. Same as authorization_basic() but will set the "Proxy-Authorization"
  421. header instead.
  422.  
  423. =back
  424.  
  425. =head1 COPYRIGHT
  426.  
  427. Copyright 1995-1998 Gisle Aas.
  428.  
  429. This library is free software; you can redistribute it and/or
  430. modify it under the same terms as Perl itself.
  431.  
  432. =cut
  433.  
  434. 1;
  435.  
  436. #__DATA__
  437.  
  438. sub clone
  439. {
  440.     my $self = shift;
  441.     my $clone = new HTTP::Headers;
  442.     $self->scan(sub { $clone->push_header(@_);} );
  443.     $clone;
  444. }
  445.  
  446. sub push_header
  447. {
  448.     Carp::croak('Usage: $h->push_header($field, $val)') if @_ != 3;
  449.     shift->_header(@_, 'PUSH');
  450. }
  451.  
  452.  
  453. sub remove_header
  454. {
  455.     my($self, @fields) = @_;
  456.     my $field;
  457.     foreach $field (@fields) {
  458.     $field =~ tr/_/-/ if $TRANSLATE_UNDERSCORE;
  459.     delete $self->{lc $field};
  460.     }
  461. }
  462.  
  463. # Convenience access functions
  464.  
  465. sub _date_header
  466. {
  467.     require HTTP::Date;
  468.     my($self, $header, $time) = @_;
  469.     my($old) = $self->_header($header);
  470.     if (defined $time) {
  471.     $self->_header($header, HTTP::Date::time2str($time));
  472.     }
  473.     HTTP::Date::str2time($old);
  474. }
  475.  
  476. sub date                { shift->_date_header('Date',                @_); }
  477. sub expires             { shift->_date_header('Expires',             @_); }
  478. sub if_modified_since   { shift->_date_header('If-Modified-Since',   @_); }
  479. sub if_unmodified_since { shift->_date_header('If-Unmodified-Since', @_); }
  480. sub last_modified       { shift->_date_header('Last-Modified',       @_); }
  481.  
  482. # This is used as a private LWP extention.  The Client-Date header is
  483. # added as a timestamp to a response when it has been received.
  484. sub client_date         { shift->_date_header('Client-Date',         @_); }
  485.  
  486. # The retry_after field is dual format (can also be a expressed as
  487. # number of seconds from now), so we don't provide an easy way to
  488. # access it until we have know how both these interfaces can be
  489. # addressed.  One possibility is to return a negative value for
  490. # relative seconds and a positive value for epoch based time values.
  491. #sub retry_after       { shift->_date_header('Retry-After',       @_); }
  492.  
  493. sub content_type      {
  494.   my $ct = (shift->_header('Content-Type', @_))[0];
  495.   return '' unless defined($ct) && length($ct);
  496.   my @ct = split(/\s*;\s*/, lc($ct));
  497.   wantarray ? @ct : $ct[0];
  498. }
  499.  
  500. sub title             { (shift->_header('Title',            @_))[0] }
  501. sub content_encoding  { (shift->_header('Content-Encoding', @_))[0] }
  502. sub content_language  { (shift->_header('Content-Language', @_))[0] }
  503. sub content_length    { (shift->_header('Content-Length',   @_))[0] }
  504.  
  505. sub user_agent        { (shift->_header('User-Agent',       @_))[0] }
  506. sub server            { (shift->_header('Server',           @_))[0] }
  507.  
  508. sub from              { (shift->_header('From',             @_))[0] }
  509. sub referer           { (shift->_header('Referer',          @_))[0] }
  510. sub warning           { (shift->_header('Warning',          @_))[0] }
  511.  
  512. sub www_authenticate  { (shift->_header('WWW-Authenticate', @_))[0] }
  513. sub authorization     { (shift->_header('Authorization',    @_))[0] }
  514.  
  515. sub proxy_authenticate  { (shift->_header('Proxy-Authenticate',  @_))[0] }
  516. sub proxy_authorization { (shift->_header('Proxy-Authorization', @_))[0] }
  517.  
  518. sub authorization_basic       { shift->_basic_auth("Authorization",       @_) }
  519. sub proxy_authorization_basic { shift->_basic_auth("Proxy-Authorization", @_) }
  520.  
  521. sub _basic_auth {
  522.     require MIME::Base64;
  523.     my($self, $h, $user, $passwd) = @_;
  524.     my($old) = $self->_header($h);
  525.     if (defined $user) {
  526.     Carp::croak("Basic authorization user name can't contain ':'")
  527.       if $user =~ /:/;
  528.     $passwd = '' unless defined $passwd;
  529.     $self->_header($h => 'Basic ' .
  530.                              MIME::Base64::encode("$user:$passwd", ''));
  531.     }
  532.     if (defined $old && $old =~ s/^\s*Basic\s+//) {
  533.     my $val = MIME::Base64::decode($old);
  534.     return $val unless wantarray;
  535.     return split(/:/, $val, 2);
  536.     }
  537.     return;
  538. }
  539.  
  540. 1;
  541.