发新话题
打印

[使用] 一个小的下载工具wget

一个小的下载工具wget

一个小的下载工具wget   下午在公司想把http://www.live555.com/liveMedia/public/doxygen/这个目录下的所有文件下载到本地。如果是一般的网页,比如会显示好多链接,那我用flashget的“下载全部”功能就可以连接。不过这个目录下只有一个index.html,其它没有在第一页显示出来,没办法,flashget用不上。那么多文件(起码500个以上),我想总不可能一个个打开,然后”另存为...“,那会将是一场噩梦。好在自己有Linux的使用经验,早知道有一款叫wget的小工具[2],能够递归下载网站目录下的所有文件,这么好,不用想,windows肯定也有相关或者它的移植。打开http://www.google.com/ 输入"wget for windows"。果然第一个就是,马上下载来,只有325K。
     进入命令提示符,到wget.exe存放的目录,运行wget。不知道怎么用,不用怕,直接输入wget,提示wget --help,按照帮助,输入,显示好多参数,直接定位到-r参数,也就是递归下载。恩,就是这个,马上输入:
wget -r http://www.live555.com/liveMedia/public/doxygen/
剩下的就是它事情了,它会自动在wget.exe的目录下建立一个www.live555.com 目录,也按照服务器的目录建立子目录。

它的其它一些参数如下(用法)[1]:
用法: wget [选项]... [URL]...
  命令的引数使用长项目与短项目相同.
  启动:
  -V, --version显示Wget的版本并且离开.
  -h, --help显示这个说明档.
  -b, -background在启动之後跳到背景去.
  -e, -execute=COMMAND执行一个`.wgetrc'里面的COMMAND指令.
  纪录档与输入的档案:
  -o, --output-file=FILE纪录讯息到FILE去.
  -a, -append-output=FILE增加讯息到FILE去.
  -d, --debug显示除错的输出.
  -q, --quiet安静模式(不输入任何讯息).
  -v, --verbose冗长模式(这是内定值).
  -nv, --non-verbose关闭verboseness,但不是安静模式.
  -i, --input-file=FILE从FILE读取URL .
  -F, --force-html把输入的档案当作HTML.
  下载:
  -t, --tries=NUMBER设定重复尝试NUMBER次(0是无限制).
  -O --output-document=FILE把文件写到FILE里.
  -nc, --no-clobber不破坏已经存在的档案.
  -c, --continue重新取得一个已经存在的档案.
  --dot-style=STYLE设定取回状况的显示风格.
  -N, --timestamping不取回比本地旧的档案.
  -S, --server-response显示伺服器回应状况.
  --spider不下载任何东西.
  -T, --timeout=SECONDS设定读取时超过的时间为SECONDS秒.
  -w, --wait=SECONDS在取回档案时等待SECONDS秒.
  -Y, --proxy=on/off开启或关闭Proxy.
  -Q, --quota=NUMBER设定取回档案的定额限制为NUMBER个.
  目录:
  -nd --no-directories不建立目录.
  -x, --force-directories强制进行目录建立的工作.
  -nH, --no-host-directories不建立主机的目录.
  -P, --directory-prefix=PREFIX把档案存到PREFIX/...
  --cut-dirs=NUMBER忽略NUMBER个远端的目录元件.
  HTTP选项:
  --http-user=USER设http使用者为USER.
  --http0passwd=PASS设http使用者的密码为PASS.
  -C, --cache=on/off提供/关闭快取伺服器资料(正常情况为提供).
  --ignore-length忽略`Content-Length'标头栏位.
  --proxy-user=USER设USER为Proxy使用者名称.
  --proxy-passwd=PASS设PASS为Proxy密码.
  -s, --save-headers储存HTTP标头成为档案.
  -U, --user-agent=AGENT使用AGENT取代Wget/VERSION作为识别代号.
  FTP选项:
  --retr-symlinks取回FTP的象徵连结.
  -g, --glob=on/off turn file name globbing on ot off.
  --passive-ftp使用"passive"传输模式.
  使用递回方式的取回:
  -r, --recursive像是吸入web的取回--请小心使用!.
  -l, --level=NUMBER递回层次的最大值(0不限制).
  --delete-after删除下载完毕的档案.
  -k, --convert-links改变没有关连的连结成为有关连.
  -m, --mirror开启适合用来映射的选项.
  -nr, --dont-remove-listing不要移除`.listing'档.
  递回式作业的允许与拒绝选项:
  -A, --accept=LIST允许的扩充项目的列表.
  -R, --reject=LIST拒绝的扩充项目的列表.
  -D, --domains=LIST允许的网域列表.
  --exclude-domains=LIST拒绝的网域列表(使用逗号来分隔).
  -L, --relative只跟随关联连结前进.
  --follow-ftp跟随HTML文件里面的FTP连结.
  -H, --span-hosts当开始递回时便到外面的主机.
  -I, --include-directories=LIST允许的目录列表.
  -X, --exclude-directories=LIST排除的目录列表.
  -nh, --no-host-lookup不透过DNS查寻主机.
  -np, --no-parent不追朔到起源目录.

[Ref.]
[1]wget参数使用参考  http://www.21ds.net/article/wgetcssyck,370.html
[2]wget project http://www.gnu.org/software/wget/
DreamHost优惠码CAODAN.只需22.4$可得200G
有事请PM至dupola。不要再PM我。谢谢。

TOP

发新话题