> 原文出處:[網絡爬蟲系列](http://blog.csdn.net/column/details/spiders.html)
作者:[dianacody](http://blog.csdn.net/dianacody)
**本系列文章經作者授權在看云整理發布,未經作者允許,請勿轉載!**
# 網絡爬蟲系列
> 系列分為兩個部分:(java版)以網易和新浪微博爬蟲實際項目為例,介紹爬蟲原理。(python版)介紹爬蟲urllib2工具爬蟲實例和scrapy框架爬蟲實例。爬蟲系列所有實例可以到github查看完整項目源碼。
- 前言
- 【java】微博爬蟲(一):小試牛刀——網易微博爬蟲(自定義關鍵字爬取微博數據)(附軟件源碼)
- 【java】微博爬蟲(二):如何抓取HTML頁面及HttpClient使用
- 【java】微博爬蟲(三):庖丁解牛——HTML結構分析與正則切分
- 【java】微博爬蟲(四):數據處理——jsoup工具解析html、dom4j讀寫xml
- 【java】微博爬蟲(五):防止爬蟲被墻的幾個技巧(總結篇)
- 【python】網絡爬蟲(一):python爬蟲概述
- 【python】網絡爬蟲(二):網易微博爬蟲軟件開發實例(附軟件源碼)
- 【python】網絡爬蟲(三):模擬登錄——偽裝瀏覽器登錄爬取過程
- 【python】網絡爬蟲(四):scrapy爬蟲框架(架構、win/linux安裝、文件結構)
- 【python】網絡爬蟲(五):scrapy爬蟲初探——爬取網頁及選擇器
- 打包python文件為exe文件(PyInstaller工具使用方法)