需要导入的库：

Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架，任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。Scratch，是抓取的意思，这个Python的爬虫框架叫Scrapy，大概也是这个意思吧，就叫它：小刮刮吧。Scrapy 使用了 Twisted异步网络库来处理网络通讯。整体架构大致如下

普通分类:

python

Read more about 教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神

一个Python小白5个小时爬虫经历

星期三, 2017-12-27 09:33 — adminshiping1

　　最近业余在做一个基于.NET Core的搜索项目，奈何基层代码写好了，没有看起来很华丽的数据供测试。很巧的也是博客搜索，于是乎想到了博客园。C#也能做做页面数据抓取的，不过在博客园看到的大部分都是python实现，所以就临时想了一下看看python到底是什么东东，不看基础语法，不看语言功能，直接上代码，哪里不会搜哪里。代码完成总共用时大概4个小时，其中搭建环境加安装BeautifulSoup大概1个小时。解析HTML用时间最多了，边看demo边解析，大概2个小时，剩下的时间就是调试加保存数据了。

普通分类:

python

Read more about 一个Python小白5个小时爬虫经历

python 多线程就这么简单有大用有大大用

星期三, 2017-12-27 07:48 — adminshiping1

普通分类:

python

Read more about python 多线程就这么简单有大用有大大用

python的多线程到底有没有用？

星期三, 2017-12-27 05:45 — adminshiping1

在群里经常听到这样的争执，有人是虚心请教问题，有人就大放厥词因为这个说python辣鸡。而争论的核心无非就是，python的多线程在同一时刻只会有一条线程跑在CPU里面，其他线程都在睡觉。这是真的吗？

普通分类:

python

Read more about python的多线程到底有没有用？

You are here

python

python随机数（random）有大用

需要导入的库：

pip命令使用详解有大用

async/await 廖雪峰

async/await

python中items =[[x, y]for (y, x) in pairs]是什么意思

马哥今日小技巧关键代码可以依赖于扩展包有大用

关键代码可以依赖于扩展包

马哥今日小技巧【Python小技巧】如何将一串大写字符转化成小写？有大用

【Python小技巧】如何将一串大写字符转化成小写？

马哥今日小技巧优化循环有大用

优化循环

马哥今日小技巧 python 使用新版本有大用

马哥今日小技巧 itertools生成排列有大用

马哥今日小技巧使用dis查看python虚拟机中字节码有大用

马哥今日小技巧字典中get方法设置默认值有大用

马哥今日小技巧类方法和静态方法实例方法差异有大用

马哥今日小技巧 s = "ajldjlajfdljfddd"，去重并从小到大排序输出"adfjl" 有大用

马哥今日小技巧按键值升序排序通过sorted结合key参数排序有大用

马哥今日小技巧 Python的try语句中except、else和finally的区别有大用

马哥今日小技巧运用python切片技巧有大用

马哥今日小技巧按value排序字典有大用

马哥今日小技巧 Python3.8的functools中新增了叫cached_property的装饰器有大用

马哥今日小技巧 Python中的is和==的区别有大用

马哥今日小技巧通过zip函数同时迭代多个序列，其可迭代次数取决于长度最小的序列。有大用

马哥今日小技巧通过itertools.chain连续迭代多个序列，看以下例子有大用

利用MD5对字符串和文件进行加密

计算文件的md5值

python

[Python]新手写爬虫全过程（已完成）

python 网络爬虫入门（一）———第一个python爬虫实例 python网络爬虫入门（二）———模拟登陆知乎 python网络爬虫入门（三）———多线程

教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神

一个Python小白5个小时爬虫经历

python 多线程就这么简单有大用有大大用

python的多线程到底有没有用？

页面

友情链接

搜索表单

用户登录

You are here

python

需要导入的库：

async/await

关键代码可以依赖于扩展包

【Python小技巧】如何将一串大写字符转化成小写？

优化循环

页面

友情链接