使用wget 去抓一个网站的文件时,有时候会碰到中文名的问题。
这时候使用wget抓的文件是乱码。
可以用wget的一个选项来解决这个问题。
--restrict-file-names=modes
改变由远程URL的字符到本地的文件名时的转义规则。
如果指定mode为nocontrol,那么控制字符的转义被关闭。当你在可以保存和使用UTF-8显示的文件名的系统中下载的URL名称中包含UTF-8字符时,该选项是有意义的。
示例:
$ wget -c --restrict-file-names=nocontrol -i filelist.txt
via.http://blog.csdn.net/robertsong2004/article/details/38875995