没有比脚更长的路,走过去,前面是个天!
2020-03-19
在request对象传往downloader的过程中调用。当返回不同类型的值的时候,行为也不一样:
阅读更多
修改请求头信息里的User-Agent
2019-12-09
123456789
os:提供了不少与操作系统相关联的函数sys: 通常用于命令行参数re: 正则匹配math: 数学运算datetime:处理日期时间
2019-12-06
声明:文章借鉴自【彻底搞懂 python 中文乱码问题】
2019-12-04
12345
filetitle = os.path.join(os.curdir, 'reads')建立文件夹,os.curdir(为当地地址),创建语法为os.path.jion, 'reads'为文件夹的名称if not os.path.isdir(fileread): os.mkdir(fileread)os.path.isdir用来判断此文件夹是否存在,不存在则重新建立,建立方法为os.mkdir()
2019-12-02
Python strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
2019-11-30
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.
2019-11-28
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
2019-11-26
以下是自己在学习爬虫时,利用正则和爬虫知识爬取豆瓣电影排行榜的一些总结,仅供参考,如有不足,还请关照
2019-11-24
Requests是Python语言编写,基于urllib3,采用Apache2 Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。是Python实现的简单易用的HTTP库。