博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬虫 Day03
阅读量:7249 次
发布时间:2019-06-29

本文共 1863 字,大约阅读时间需要 6 分钟。

import requestsrespones=requests.get(url='http://www.baidu.com')respones.encoding='UTF-8'print(respones.text)with open ('badui.html','w',encoding='UTF-8')as f:    f.write(respones.text)#爬baidu主页写成HTML

今日学习:

爬豆瓣

https://movie.douban.com/top250?start=0&filter=https://movie.douban.com/top250?start=25&filter=https://movie.douban.com/top250?start=50&filter=1.发送请求2.解析数据3.保存数据'''import requestsimport re# 爬虫三部曲# 1.发送请求def get_page(base_url):    response = requests.get(base_url)    return response# 2.解析文本def parse_index(text):    res = re.findall('

 

转载于:https://www.cnblogs.com/AMNC/p/11094389.html

你可能感兴趣的文章
QuickBI助你成为分析师-保证数据安全:行级权限
查看>>
记录安全扫描后进行的代码重构各类问题以及处理办法
查看>>
三周第一次课
查看>>
解决手机运行appium会自动安装settingapp和unlock
查看>>
SAP S/4HANA CDS View的访问控制实现:DCL介绍
查看>>
快速了解掌握中文自然语言处理
查看>>
omni core api速查表
查看>>
比特币 的 正统 ——BCH
查看>>
【2018.07.11学习笔记】【linux高级知识 20.1-20.4】
查看>>
Spring Cloud Config客户端使用
查看>>
多年经验的大牛总结出来的Python案例超详细
查看>>
Gradle实现Android多渠道定制化打包
查看>>
Ubuntu 16.4下 Docker 安装文档
查看>>
GoJS图表组件简介
查看>>
百度AI开放平台,共建AI生态
查看>>
ES6 fetch函数与后台交互实现
查看>>
盘点5月份GitHub上最热门的开源项目
查看>>
SpringBoot + Dubbo的项目如何优雅停机
查看>>
Eclipse设置源文件的编码方式UTF-8
查看>>
ppt如何导出成高清图片
查看>>