home *** CD-ROM | disk | FTP | other *** search
/ PC World 2004 November / PCWorld_2004-11_cd.bin / software / topware / activeperl / ActivePerl-5.8.4.810-MSWin32-x86.exe / ActivePerl-5.8.4.810 / Perl / bin / lwp-download < prev    next >
Text File  |  2004-06-01  |  7KB  |  289 lines

  1. #!/usr/bin/perl -w
  2.  
  3. # $Id: lwp-download,v 2.6 2004/04/09 21:31:29 gisle Exp $
  4.  
  5. =head1 NAME
  6.  
  7. lwp-download - Fetch large files from the web
  8.  
  9. =head1 SYNOPSIS
  10.  
  11.  lwp-download [-a] <url> [<local file>]
  12.  
  13. =head1 DESCRIPTION
  14.  
  15. The I<lwp-download> program will down load the document specified by the URL
  16. given as the first command line argument to a local file.  The local
  17. filename used to save the document is guessed from the URL unless
  18. specified as the second command line argument.
  19.  
  20. The I<lwp-download> program is implemented using the I<libwww-perl>
  21. library.  It is better suited to down load big files than the
  22. I<lwp-request> program because it does not store the file in memory.
  23. Another benefit is that it will keep you updated about its progress
  24. and that you don't have much options to worry about.
  25.  
  26. Use the C<-a> option to save the file in text (ascii) mode.  Might make a
  27. difference on dosish systems.
  28.  
  29. =head1 EXAMPLE
  30.  
  31. Fetch the newest and greatest perl version:
  32.  
  33.  $ lwp-download http://www.perl.com/CPAN/src/latest.tar.gz
  34.  Saving to 'latest.tar.gz'...
  35.  11.4 MB received in 8 seconds (1.43 MB/sec)
  36.  
  37. =head1 AUTHOR
  38.  
  39. Gisle Aas <gisle@aas.no>
  40.  
  41. =cut
  42.  
  43. #' get emacs out of quote mode
  44.  
  45. use strict;
  46.  
  47. use LWP::UserAgent ();
  48. use LWP::MediaTypes qw(guess_media_type media_suffix);
  49. use URI ();
  50. use HTTP::Date ();
  51.  
  52. my $progname = $0;
  53. $progname =~ s,.*/,,;    # only basename left in progname
  54. $progname =~ s/\.\w*$//; # strip extension if any
  55.  
  56. #parse option
  57. use Getopt::Std;
  58. my %opt;
  59. unless (getopts('a', \%opt)) {
  60.     usage();
  61. }
  62.  
  63. my $url = URI->new(shift || usage());
  64. my $argfile = shift;
  65. my $version = q$Revision: 2.6 $;
  66.  
  67. my $ua = new LWP::UserAgent;
  68.  
  69. $ua->agent("lwp-download/$version " . $ua->agent);
  70. $ua->env_proxy;
  71.  
  72. my $req = new HTTP::Request GET => $url;
  73.  
  74. my $file;      # name of file we download into
  75. my $length;    # total number of bytes to download
  76. my $flength;   # formatted length
  77. my $size = 0;  # number of bytes received
  78. my $start_t;   # start time of download
  79. my $last_dur;  # time of last callback
  80.  
  81. my $shown = 0; # have we called the show() function yet
  82.  
  83. $SIG{INT} = sub { die "Interrupted\n"; };
  84.  
  85. $| = 1;  # autoflush
  86.  
  87. my $res = $ua->request($req,
  88.   sub {
  89.       unless($file) {
  90.       my $res = $_[1];
  91.       unless ($argfile) {
  92.           # must find a suitable name to use.  First thing
  93.           # to do is to look for the "Content-Disposition"
  94.           # header defined by RFC1806.  This is also supported
  95.           # by Netscape
  96.           my $cd = $res->header("Content-Disposition");
  97.           if ($cd && $cd =~ /\bfilename\s*=\s*(\S+)/) {
  98.           $file = $1;
  99.           $file =~ s/;$//;
  100.           $file =~ s/^([\"\'])(.*)\1$/$2/;
  101.           }
  102.         
  103.           # if this fails we try to make something from the URL
  104.           unless ($file) {
  105.           my $req = $res->request;  # now always there
  106.           my $rurl = $req ? $req->url : $url;
  107.           
  108.           $file = ($rurl->path_segments)[-1];
  109.           if (!defined($file) || !length($file)) {
  110.               $file = "index";
  111.               my $suffix = media_suffix($res->content_type);
  112.               $file .= ".$suffix" if $suffix;
  113.           }
  114.           elsif ($rurl->scheme eq 'ftp' ||
  115.                $file =~ /\.t[bg]z$/   ||
  116.                $file =~ /\.tar(\.(Z|gz|bz2?))?$/
  117.               ) {
  118.               # leave the filename as it was
  119.           }
  120.           else {
  121.               my $ct = guess_media_type($file);
  122.               unless ($ct eq $res->content_type) {
  123.               # need a better suffix for this type
  124.               my $suffix = media_suffix($res->content_type);
  125.               $file .= ".$suffix" if $suffix;
  126.               }
  127.           }
  128.           }
  129.  
  130.           # Check if the file is already present
  131.           if (-f $file && -t) {
  132.           $shown = 1;
  133.           print "Overwrite $file? [y] ";
  134.           my $ans = <STDIN>;
  135.           unless (defined($ans) && $ans =~ /^y?\n/) {
  136.               if (defined $ans) {
  137.               print "Ok, aborting.\n";
  138.               }
  139.               else {
  140.               print "\nAborting.\n";
  141.               }
  142.               exit 1;
  143.           }
  144.           $shown = 0;
  145.           }
  146.           else {
  147.           print "Saving to '$file'...\n";
  148.           }
  149.       }
  150.       else {
  151.           $file = $argfile;
  152.       }
  153.       open(FILE, ">$file") || die "Can't open $file: $!";
  154.           binmode FILE unless $opt{a};
  155.       $length = $res->content_length;
  156.       $flength = fbytes($length) if defined $length;
  157.       $start_t = time;
  158.       $last_dur = 0;
  159.       }
  160.  
  161.       print FILE $_[0] or die "Can't write to $file: $!";
  162.       $size += length($_[0]);
  163.  
  164.       if (defined $length) {
  165.       my $dur  = time - $start_t;
  166.       if ($dur != $last_dur) {  # don't update too often
  167.           $last_dur = $dur;
  168.           my $perc = $size / $length;
  169.           my $speed;
  170.           $speed = fbytes($size/$dur) . "/sec" if $dur > 3;
  171.           my $secs_left = fduration($dur/$perc - $dur);
  172.           $perc = int($perc*100);
  173.           my $show = "$perc% of $flength";
  174.           $show .= " (at $speed, $secs_left remaining)" if $speed;
  175.           show($show, 1);
  176.       }
  177.       }
  178.       else {
  179.       show( fbytes($size) . " received");
  180.       }
  181.   }
  182. );
  183.  
  184. if (fileno(FILE)) {
  185.     close(FILE) || die "Can't write to $file: $!";
  186.  
  187.     show("");  # clear text
  188.     print "\r";
  189.     print fbytes($size);
  190.     print " of ", fbytes($length) if defined($length) && $length != $size;
  191.     print " received";
  192.     my $dur = time - $start_t;
  193.     if ($dur) {
  194.     my $speed = fbytes($size/$dur) . "/sec";
  195.     print " in ", fduration($dur), " ($speed)";
  196.     }
  197.     print "\n";
  198.  
  199.     if (my $mtime = $res->last_modified) {
  200.     utime time, $mtime, $file;
  201.     }
  202.  
  203.     if ($res->header("X-Died") || !$res->is_success) {
  204.     if (-t) {
  205.         print "Transfer aborted.  Delete $file? [n] ";
  206.         my $ans = <STDIN>;
  207.         if (defined($ans) && $ans =~ /^y\n/) {
  208.         unlink($file) && print "Deleted.\n";
  209.         }
  210.         elsif ($length > $size) {
  211.         print "Truncated file kept: ", fbytes($length - $size), " missing\n";
  212.         }
  213.         else {
  214.         print "File kept.\n";
  215.         }
  216.             exit 1;
  217.     }
  218.     else {
  219.         print "Transfer aborted, $file kept\n";
  220.     }
  221.     }
  222.     exit 0;
  223. }
  224.  
  225. # Did not manage to create any file
  226. print "\n" if $shown;
  227. if ($res->header("X-Died")) {
  228.     print "$progname: Aborted\n";
  229. }
  230. else {
  231.     print "$progname: ", $res->status_line, "\n";
  232. }
  233. exit 1;
  234.  
  235.  
  236. sub fbytes
  237. {
  238.     my $n = int(shift);
  239.     if ($n >= 1024 * 1024) {
  240.     return sprintf "%.3g MB", $n / (1024.0 * 1024);
  241.     }
  242.     elsif ($n >= 1024) {
  243.     return sprintf "%.3g KB", $n / 1024.0;
  244.     }
  245.     else {
  246.     return "$n bytes";
  247.     }
  248. }
  249.  
  250. sub fduration
  251. {
  252.     use integer;
  253.     my $secs = int(shift);
  254.     my $hours = $secs / (60*60);
  255.     $secs -= $hours * 60*60;
  256.     my $mins = $secs / 60;
  257.     $secs %= 60;
  258.     if ($hours) {
  259.     return "$hours hours $mins minutes";
  260.     }
  261.     elsif ($mins >= 2) {
  262.     return "$mins minutes";
  263.     }
  264.     else {
  265.     $secs += $mins * 60;
  266.     return "$secs seconds";
  267.     }
  268. }
  269.  
  270.  
  271. BEGIN {
  272.     my @ani = qw(- \ | /);
  273.     my $ani = 0;
  274.  
  275.     sub show
  276.     {
  277.         my($mess, $show_ani) = @_;
  278.         print "\r$mess" . (" " x (75 - length $mess));
  279.     print $show_ani ? "$ani[$ani++]\b" : " ";
  280.         $ani %= @ani;
  281.         $shown++;
  282.     }
  283. }
  284.  
  285. sub usage
  286. {
  287.     die "Usage: $progname [-a] <url> [<lpath>]\n";
  288. }
  289.