大飞

关注TA

挑战一切！

世界的顶端
混口饭吃
写了333,609字

Nemo

在文章《网站搭建之坑》中回复：
```
赞?
```
Nemo

在文章《Vue 跨域请求》中回复：
```
点赞点赞~
```
Nemo

在文章《无障碍模式监听微信聊天记录》中回复：
```
阔以，手机还是别给别人玩了...
```
Nemo

在文章《Python 多线程爬取网站小说》中回复：
```
赞！
```
Nemo

在文章《2018年刑侦科目推理试题答案》中回复：
```
非常Nice~！
```
随遇而安

在文章《Android 通用混淆》中回复：
```
赞赞赞
```

Nemo

在文章《Android 通用混淆》中回复：

哟，干货呀，推荐给身边做安卓的朋友了。

TIM图片20170509180148

Nemo

在文章《破解百度云垃圾速度》中回复：

不错。不过建议抓取地址用ex脚本，其他浏览器也可以用。

Nemo

在文章《python 切片和迭代》中回复：
```
回复大飞：哈哈，说得好！
```
Nemo

在文章《python 切片和迭代》中回复：
```
6666，都开始玩python了呀。
```

该文章投稿至Nemo社区 Python 板块复制链接

Python 简单网络爬虫爬取图片

发布于 2018/01/14 22:30 1,363浏览 0回复 555字

原理：

1.抓取网页内容

2.从网页内容读取图片链接

代码（详解见代码）：

import requests
import re
import time
# 获取到网页内容
r = requests.get('https://www.douyu.com') # 斗鱼
html=r.text
# 通过正则表达式获取网页内容的图片
images=re.findall(r'data-original="(.*?\.(jpg|png))"',html)
print(images)
# 通过遍历下载图片存储到本地
for image in images:
    s=image[0]
    index=s.rindex('/')
    # 睡眠一秒下载
    time.sleep(1)
    req=requests.get(s)
    # 将文件url文件最后一个/后面的字符作为文件名称
    with open('/Users/lyf/test/%s'%s[index+1:],'wb') as code:
        code.write(req.content)

效果

E56C2FF2-89AF-43EE-AAAC-51A2650CF1D7

本文标签
python

上一个文章：Android app 被后台杀死问题

下一个文章：破解百度云垃圾速度

点了个评

大飞

最近回复

Python 简单网络爬虫爬取图片

点击排行

没有找到这位爷的热门文章哦~

最新文章

测试从相机选取照片

Jenkins Android打包配置pipeline

网站搭建之坑

flutter 开篇

Android 自建maven库

Android 自建Snapshot依赖库无法更新问题

Android 表现模式MVP-VM

Python 图片压缩工具改进版

python--- 图片压缩工具

Python--教你如何注入大量垃圾文章