发布时间:2019-06-26 09:48:38编辑:auto阅读(2151)
一个通过正则匹配来下载指定页面图片的示例,
几个可能出错的地方都用print打印出来,可以观察是否正确。
目标站点::http://www.tupian.com/tag/xinggan
#引入数据包
import re
import urllib
#定义获得url中HTML代码的方法。
def getHtml(url):
page=urllib.urlopen(url)
html = page.read()
return html
#获得指定网站的源代码
html =getHtml("http://www.tupian.com/tag/xinggan")
#显示出来查看是否正确。
print html
clear
#正则表达式对比截取图片文件路径
printre.findall(r'src="(.*?\.jpg)"alt',html)
imglist =re.findall(r'src="(.*?\.jpg)"alt',html)
#迭代下载图片,另存为1的叠加
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' %x)
x+=1
上一篇: 关于CentOS下python无法安装m
下一篇: Python学习之(一)在eclipse
50065
49325
39985
37026
31418
28258
27215
22007
21964
20292
442°
327°
302°
490°
462°
1081°
2021°
1869°
1482°
3000°