# lxml
1. pip安裝
>pip install lxml
2. wheel安裝
>https://pypi.org/project/lxml/#files
>pip install lxml-4.2.5-cp37-cp37m-win_amd64.whl
3. 驗證安裝
import lxml
# Beautiful Soup
- pip安裝
>pip install beautifulsoup4
- 驗證安裝
```
from bs4 import BeautifulSoup
soup = BeautifulSoup('<p>Hello</p>','lxml')
print(soup.p.string)
```
# pyquery
1. 相關鏈接
>https://pyquery.readthedocs.io/en/latest/
2. pip安裝
>pip install pyquery
3. wheel安裝
>https://pypi.org/project/pyquery/#files
>pip install pyquery-1.4.0-py2.py3-none-any.whl
4. 驗證安裝
import pyquery
# tesserocr
1. 相關鏈接
>https://digi.bib.uni-mannheim.de/tesseract/
2. Windows下安裝,雙擊運行`tesseract-ocr-setup-3.05.01.exe`,此時可以勾選Additional language data(download)選項來安裝OCR識別支持的語言包,這樣OCR便可以識別多國語言,語言較多,下載時間會比較長,請耐心等待,然后一路點擊Next按鈕即可。
3. 安裝完成后,需要設置兩個環境變量 $PATH(直接填入安裝的路徑) 和 $TESSDATA_PREFIX(這個需要新建)
4. 驗證安裝 `tesseract -v`
5. wheel安裝tesserocr
>https://github.com/simonflueckiger/tesserocr-windows_build/releases
>pip install tesserocr-2.3.1-cp37-cp37m-win_amd64
6.
- 工欲善其事必先利其器
- 請求庫
- 解析庫
- 數據庫
- 存儲庫
- Web庫
- app爬取相關庫
- 爬蟲框架
- 部署相關庫
- ipython
- 基礎
- 數學函數
- 隨機函數
- 三角函數
- 字符串內建函數
- 列表方法
- 字典內置方法
- 正則表達式
- os
- 字符串及數字的判斷
- 常用魔術方法
- db
- mongodb
- mysql
- redis
- ORM
- ODM
- mongodb操作方法
- sqlite3
- access
- files
- Excel
- xml文件
- Python環境
- anaconda
- pip常用命令
- virtualenv
- pyenv
- cmder
- 遠程開發
- Jupyter
- crawler
- appium環境搭建
- adb工具
- uiautomator
- 運行Appium+Python Clinet + 夜神模擬器
- DesiredCapabilities參數大全
- requests
- scrapy
- gerapy
- scrapyd
- 請求頭fake_useragent庫
- 數據傳遞過程
- 數據清洗及入庫pipelines.py
- scrapy調用阿布云代理
- 圖片下載
- PyQt5
- pyinstaller
- 攻防
- xss
- xss反射
- Chrome模擬微信瀏覽器
- flask
- 注冊app
- 藍圖Blueprint
- 表單驗證wtforms
- Flask-SQLAlchemy
- 數據處理
- json
- tornado
- settings
- 工具
- fiddler
- ab壓力測試工具
- 高階
- 隊列
- 多線程
- 消息隊列
- 定時任務框架APScheduler
- Django
- 路由分離
- 模型
- admin
- Android
- apk逆向工程