使用wget抓取网页内容,常规用法及有用参数
环境:linux系统(各种发行版皆可),windows下强烈推荐cygwin环境
常规用法:
- 直接下载一个文件,默认按最后一级文件名保存到本地: wget {your-url}
- 如需自定义保存文件名则增加参数 -O 指定保留文件路径: wget -O {save-file-name} {your-url}
- 下载一批文件,把文件路径放到一个文本文件中,每行一个: wget -i {file-name-of-your-filelist}
- 下载一个页面及页面中图片等元素,wget -p {your-url} ,即增加参数 –page-requisites ([……]