## 關于
首先,在此附上項目的地址,以及官方文檔
[PySpider](https://github.com/binux/pyspider)?[官方文檔](http://docs.pyspider.org/en/latest/)
## 安裝
### 1\. pip
首先確保你已經安裝了pip,若沒有安裝,請參照
[pip安裝](http://pip-cn.readthedocs.org/en/latest/installing.html)
### 2\. phantomjs
PhantomJS 是一個基于 WebKit 的服務器端 JavaScript API。它全面支持web而不需瀏覽器支持,其快速、原生支持各種Web標準:DOM 處理、CSS 選擇器、JSON、Canvas 和 SVG。 PhantomJS 可以用于頁面自動化、網絡監測、網頁截屏以及無界面測試等。
[安裝](http://phantomjs.org/download.html)
以上附有官方安裝方式,如果你是 Ubuntu 或 Mac OS X用戶,可以直接用命令來安裝
Ubuntu:
~~~
sudo apt-get install phantomjs
~~~
Mac OS X:
~~~
brew install phantomjs
~~~
### 3\. pyspider
直接利用 pip 安裝即可
~~~
pip install pyspider
~~~
如果你是 Ubuntu 用戶,請提前安裝好以下支持類庫
~~~
sudo apt-get install python python-dev python-distribute python-pip libcurl4-openssl-dev libxml2-dev libxslt1-dev python-lxml
~~~
測試
如果安裝過程沒有提示任何錯誤,那就證明一些OK。
命令行輸入
~~~
pyspider all
~~~
然后瀏覽器訪問?[http://localhost:5000](http://localhost:5000/)
觀察一下效果,如果可以正常出現 PySpider 的頁面,那證明一切OK
在此附圖一張,這是我寫了幾個爬蟲之后的界面。
[](http://qiniu.cuiqingcai.com/wp-content/uploads/2016/02/2016-02-11-20.55.36.png)
好,接下來我會進一步介紹這個框架的使用。
## 常見錯誤
嗯,自行谷歌,就是這么任性。
- Python爬蟲入門
- (1):綜述
- (2):爬蟲基礎了解
- (3):Urllib庫的基本使用
- (4):Urllib庫的高級用法
- (5):URLError異常處理
- (6):Cookie的使用
- (7):正則表達式
- (8):Beautiful Soup的用法
- Python爬蟲進階
- Python爬蟲進階一之爬蟲框架概述
- Python爬蟲進階二之PySpider框架安裝配置
- Python爬蟲進階三之Scrapy框架安裝配置
- Python爬蟲進階四之PySpider的用法
- Python爬蟲實戰
- Python爬蟲實戰(1):爬取糗事百科段子
- Python爬蟲實戰(2):百度貼吧帖子
- Python爬蟲實戰(3):計算大學本學期績點
- Python爬蟲實戰(4):模擬登錄淘寶并獲取所有訂單
- Python爬蟲實戰(5):抓取淘寶MM照片
- Python爬蟲實戰(6):抓取愛問知識人問題并保存至數據庫
- Python爬蟲利器
- Python爬蟲文章
- Python爬蟲(一)--豆瓣電影抓站小結(成功抓取Top100電影)
- Python爬蟲(二)--Coursera抓站小結
- Python爬蟲(三)-Socket網絡編程
- Python爬蟲(四)--多線程
- Python爬蟲(五)--多線程續(Queue)
- Python爬蟲(六)--Scrapy框架學習
- Python爬蟲(七)--Scrapy模擬登錄
- Python筆記
- python 知乎爬蟲
- Python 爬蟲之——模擬登陸
- python的urllib2 模塊解析
- 蜘蛛項目要用的數據庫操作
- gzip 壓縮格式的網站處理方法
- 通過瀏覽器的調試得出 headers轉換成字典
- Python登錄到weibo.com
- weibo v1.4.5 支持 RSA協議(模擬微博登錄)
- 搭建Scrapy爬蟲的開發環境
- 知乎精華回答的非專業大數據統計
- 基于PySpider的weibo.cn爬蟲
- Python-實現批量抓取妹子圖片
- Python庫
- python數據庫-mysql
- 圖片處理庫PIL
- Mac OS X安裝 Scrapy、PIL、BeautifulSoup
- 正則表達式 re模塊
- 郵件正則
- 正則匹配,但過濾某些字符串
- dict使用方法和快捷查找
- httplib2 庫的使用