Python爬蟲進階二之PySpider框架安裝配置 · Python爬蟲

## 關于首先，在此附上項目的地址，以及官方文檔 [PySpider](https://github.com/binux/pyspider)?[官方文檔](http://docs.pyspider.org/en/latest/) ## 安裝 ### 1\. pip 首先確保你已經安裝了pip，若沒有安裝，請參照 [pip安裝](http://pip-cn.readthedocs.org/en/latest/installing.html) ### 2\. phantomjs PhantomJS 是一個基于 WebKit 的服務器端 JavaScript API。它全面支持web而不需瀏覽器支持，其快速、原生支持各種Web標準：DOM 處理、CSS 選擇器、JSON、Canvas 和 SVG。 PhantomJS 可以用于頁面自動化、網絡監測、網頁截屏以及無界面測試等。 [安裝](http://phantomjs.org/download.html) 以上附有官方安裝方式，如果你是 Ubuntu 或 Mac OS X用戶，可以直接用命令來安裝 Ubuntu: ~~~ sudo apt-get install phantomjs ~~~ Mac OS X: ~~~ brew install phantomjs ~~~ ### 3\. pyspider 直接利用 pip 安裝即可 ~~~ pip install pyspider ~~~ 如果你是 Ubuntu 用戶，請提前安裝好以下支持類庫 ~~~ sudo apt-get install python python-dev python-distribute python-pip libcurl4-openssl-dev libxml2-dev libxslt1-dev python-lxml ~~~ 測試如果安裝過程沒有提示任何錯誤，那就證明一些OK。命令行輸入 ~~~ pyspider all ~~~ 然后瀏覽器訪問?[http://localhost:5000](http://localhost:5000/) 觀察一下效果，如果可以正常出現 PySpider 的頁面，那證明一切OK 在此附圖一張，這是我寫了幾個爬蟲之后的界面。 [![](https://box.kancloud.cn/2016-05-29_574a8e648ca72.png)](http://qiniu.cuiqingcai.com/wp-content/uploads/2016/02/2016-02-11-20.55.36.png) 好，接下來我會進一步介紹這個框架的使用。 ## 常見錯誤嗯，自行谷歌，就是這么任性。