飞污熊小站

个人知识星球，专注于Python/Java/AI技术

Scrapy笔记02- 完整示例

XiongNeng 发布于 2016-03-10 收录于 Python

这篇文章我们通过一个比较完整的例子来教你使用Scrapy，我选择爬取虎嗅网首页的新闻列表。

这里我们将完成如下几个步骤：

Scrapy使用Python语言编写，如果你对这门语言还不熟，请先去学习下基本知识。

XiongNeng 发布于 2016-03-08 收录于 Python

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取(更确切来说,网络抓取)所设计的，也可以应用在获取API所返回的数据(比如Web Services)或者通用的网络爬虫。

XiongNeng 发布于 2016-03-06 收录于 DevOps

最今天我又折腾了我的博客，将它从octopress迁移到hexo上来。之前还专门写了一篇怎样利用octopress搭建博客的文章，最近试用了一下hexo，毫不犹豫的迁移过来了，实在是忍受不了octopress的速度，还有稳定性，经常莫名其妙的出错。

XiongNeng 发布于 2015-12-30 收录于 Python

Web应用开发可以说是目前软件开发中最重要的部分。Web开发也经历了好几个阶段：静态Web页面、CGI、ASP/JSP/PHP、MVC。

目前，Web开发技术仍在快速发展中，异步开发、新的MVVM前端技术层出不穷。

XiongNeng 发布于 2015-12-28 收录于 Python

自从互联网诞生以来，现在基本上所有的程序都是网络程序。网络编程对所有开发语言都是一样的，Python也不例外。用Python进行网络编程，就是在Python程序本身这个进程内，连接别的服务器进程的通信端口进行通信。本章我们将详细介绍Python网络编程的概念和最主要的两种网络类型的编程。

XiongNeng 发布于 2015-12-24 收录于 Python

操作数据库是最常见的任务，这里用MySQL来做演示，也是我们用的最多的一个开源数据库，其他都类似的。

对于安装MySQL就不做介绍了，安装完后，还需要安装去驱动。因为需要支持Python的MySQL驱动来连接到MySQL服务器。 MySQL的驱动有多种实现，比如纯python实现的pymysql和mysql-connector，或者mysql-python也就是MySQLdb。