博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
linux学习笔记-wget相关知识
阅读量:4968 次
发布时间:2019-06-12

本文共 2449 字,大约阅读时间需要 8 分钟。

wget是非交互式的网络文件下载工具,这里参考帮助文档,记录下实用参数和使用方法。

一.wget的实用参数:

wget:

用法: wget [选项]... [URL]...

启动:

-b, --background 启动后转入后台

日志和输入文件:

-o, --output-file=文件 将日志信息写入 FILE

-a, --append-output=文件 将信息添加至 FILE

-q, --quiet 安静模式 (无信息输出)

-v, --verbose 详尽的输出 (此为默认值)

-nv, --no-verbose 关闭详尽输出,但不进入安静模式

  --report-speed=类型 以 <类型> 报告带宽。类型可以是 bits

-i, --input-file=文件 下载本地或外部 <文件> 中的 URL

-F, --force-html 把输入文件当成 HTML 文件

-B, --base=URL 解析相对于 URL 的 HTML 输入文件链接 (-i -F)

  --config=文件 指定要使用的配置文件
  --no-cookies 不读取任何配置文件
  --rejected-log=文件 将拒绝 URL 的原因写入 <文件>

下载:

-t, --tries=数字 设置重试次数为 <数字> (0 代表无限制)

  --retry-connrefused 即使拒绝连接也是重试
  --retry-on-http-error=ERRORS 以逗号分隔的HTTP错误列表,以便重试

-O, --output-document=文件 将文档写入 FILE

-nc, --no-clobber 不要下载已存在将被覆盖的文件

  --no-netrc 不要尝试从.netrc获取凭据

-c, --continue 断点续传下载文件

  --progress=类型 选择进度条类型
-N, --timestamping 只获取比本地文件新的文件

  --no-use-server-timestamps 不用服务器上的时间戳来设置本地文件

-S, --server-response 打印服务器响应

  --spider 不下载任何文件

-T, --timeout=SECONDS 将所有超时设为 SECONDS 秒

目录:

-nd, --no-directories 不创建目录

-x, --force-directories 强制创建目录
-nH, --no-host-directories 不要创建主 (host) 目录
  --protocol-directories 在目录中使用协议名称
-P, --directory-prefix=前缀 保存文件到 <前缀>/..
  --cut-dirs=数字 忽略远程目录中 <数字> 个目录层。

HTTP 选项:

--default-page=NAME 改变默认页 (通常是“index.html”)。

-E, --adjust-extension 以合适的扩展名保存 HTML/CSS 文档

--no-check-certificate 不实用验证证书进行http请求

FTP 选项:

--retr-symlinks 递归目录时,获取链接的文件 (而非目录)

递归下载: -r, --recursive 指定递归下载

-l, --level=数字 最大递归深度 (inf 或 0 代表无限制,即全部下载)。
  --delete-after 下载完成后删除本地文件
-k, --convert-links 让下载得到的 HTML 或 CSS 中的链接指向本地文件
  --convert-file-only 只转换 URL 的文件部分(一般叫做“基础名”/basename)
  --backups=N 写入文件 X 前,轮换移动最多 N 个备份文件
-K, --backup-converted 在转换文件 X 前先将它备份为 X.orig。
-m, --mirror -N -r -l inf --no-remove-listing 的缩写形式。
-p, --page-requisites 下载所有用于显示 HTML 页面的图片之类的元素。
  --strict-comments 用严格方式 (SGML) 处理 HTML 注释。

递归接受/拒绝:

-A, --accept=列表 逗号分隔的可接受的扩展名列表

-H, --span-hosts 递归时转向外部主机

-np, --no-parent 不追溯至父目录

-L, --relative 仅跟踪相对链接

–accept=可以接受的文件类型

–reject=拒绝接受的文件类型。

二.wget的一些使用方法

1.直接下载某个文件

wget    [URL]...

2.下载某个网站目录下的全部文件

wget -c -r -np -k -L -p ... [URL]...

此处可以加-nd参数不创建层级目录

三.出现一些错误的解决方法

1.报错内容为不能解析域名:

原因1:未正确连接网络

原因2: dns设置错误导致不能解析域名

解决办法1:安装dncpcd或dhcp,并启动启动相应服务

解决办法2:打开/etc/resolv.conf文件,加入谷歌的dns服务器地址如下

8.8.8.88.8.4.4

原因3:使用的连接地址是svn开头的URL

尝试解决办法:更改svm为http或ftp,有部分网站可以正常使用

2.报错内容为不能进行证书校验

原因1:未正确安装make-ca软件包

解决办法1:安装make-ca,并正确更新证书配置

解决办法2:使用--no-check-certificate参数,不进行证书校验

转载于:https://www.cnblogs.com/renren-study-notes/p/10464048.html

你可能感兴趣的文章
python逻辑回归分类MNIST数据集
查看>>
检查bug
查看>>
桶排序,计数排序算法
查看>>
轮播图原生js实现和jquery实现和js面向对象方式实现
查看>>
JQuery基础 2015-8-19(第97天)
查看>>
Windbg调试托管代码
查看>>
C# Web Service 根据WSDL文件和地址添加web引用
查看>>
20162311 《程序设计与数据结构》第一周学习总结
查看>>
tensorflow 基础学习七:模型的持久化
查看>>
Linux - iconv 使用 - 处理 curl 乱码问题
查看>>
python装饰器 & flask 通过装饰器 实现 单点登录验证
查看>>
Oracle PL/SQL 程序设计读书笔记 - 第17章 过程、函数与参数
查看>>
Win右键管理员权限的获取
查看>>
软POS、硬POS对比
查看>>
Objective-C文件和目录操作,IOS文件操作,NSFileManager使用文件操作
查看>>
eclipse快捷键记录
查看>>
c/c++ 图相关的函数(二维数组法)
查看>>
e-chart 本地加载中国地图
查看>>
ifconfig
查看>>
[UE4]更新Flag坐标
查看>>