<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ## PHP數據采集指南 數據采集對于后端開發者來說是一項必不可少的技能,對于PHP開箱即用的框架便是[QueryList](https://querylist.cc/),上手比較容易,可以很方便的集成到框架中。此教程可以幫你解決以下一些采集難點: 1. 有防采集,例如開啟了cc(采集需要持續訪問目標網站,也是屬于cc的一種); 2. 目標網站使用了自定義字體文字(woff等),更有甚者使用了動態字體文字,直接采集那就是亂碼; 3. 目標網站有IP訪問限制,頻率限制等,此時我們應該如何保證采集到數據,而不是拒絕訪問; 4. 利用專業的采集工具[Puppeteer](https://github.com/puppeteer/puppeteer)采集我們想要的數據,包括屏幕截圖,自動登錄,自動填表,自定義樣式和js,采集異步加載的數據等; 5. 有些網站數據是用圖片展示的,我們不能直接獲得文本信息,利用[Tesseract OCR](https://github.com/tesseract-ocr/tesseract)幫我們做圖片文本識別; 6. 圖片的處理,使用[ImageMagick](https://imagemagick.org/)處理圖片(主要針對命令行處理),灰度處理,裁剪,顏色轉換等; 7. 高階技能增加IP代理池,突破目標網站IP限制,這里包含付費的代理和免費,根據各自情況取舍; > 此教程可能使用到的技能:PHP,swoole,linux,shell,python,node,npm,js,css等。 > 1.本教程采集的目標網址均是互聯網公開數據,僅用作教學演示使用,如有侵權,請及時聯系我; > > 2.對于彩票開獎數據的采集說明:不銷售彩票、不提供任何技術支持、不接觸用戶的APP或業務;不提供任何的咨詢服務、不接觸任何違反法律的內容;不提供任何廣告業務、不提供中介合作橋梁等; > > 3.所有實例僅作為教學演示,不保證采集數據正確性。 > 4.教程持續更新,如果有教程方面的需求可以郵件(menzhulily@gmail.com)發給我,我會抽時間更新。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看