<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                企業??AI智能體構建引擎,智能編排和調試,一鍵部署,支持知識庫和私有化部署方案 廣告
                本人是搞Java、Android開發的,有編程基礎。python是剛剛起步學習,在看完《Head first python》這本書后,一直想做一個項目練練手,思來想去不知道做python什么項目好,看網上大家都在玩爬蟲。所以自己也花了一個晚上的時間寫了個抓取“妹子圖片”的爬蟲,養眼的福利噢 O(∩_∩)O。大家需要注意博主用的是Python3.x 。在2.7上多線程的實現與3.x不同,所以需要自己調整代碼。 先上截圖,看看成果: ![](https://box.kancloud.cn/2016-05-29_574a961dc0526.jpg) 如何執行: 命令行窗口: python GetMezi.py ?圖片地址 ? 即可。默認會在代碼文件的同一級目錄創建相冊目錄,并把圖片放到對應的相冊。 ![](https://box.kancloud.cn/2016-05-29_574a961dd9b3a.jpg) 怎么樣,看到這里,是不是也想自己動手打造一個爬圖神器了。 那咱就言歸正傳,現在開始爬蟲的設計: python用到的庫:BeautifulSoup、request **一、找個圖片網站,分析它頁面上的HTML源代碼,**提取HTML源代碼中有用信息(圖片鏈接、名稱)**** ****二、多線程并發下載圖片到本地** ** 分析網站,我們瀏覽器F12,進入開發者模式,通過箭頭查找模式找到圖片顯示區域的父容器: 這個標簽內有好多個標簽,li標簽內部有標簽,我們要提取的內容就是href的地址(即相冊地址),以及相冊描述 ![](https://box.kancloud.cn/2016-05-29_574a961e094c0.jpg) 光有相冊的信息還不夠,我們還要去相冊的網頁看一下,把相冊里面的所有圖片鏈接給提取出來。 ![](https://box.kancloud.cn/2016-05-29_574a961e2c5e8.jpg) 分析該頁面,我們發現它的html源代碼中有這個地方就是相冊內圖片的導航區域(即 上下圖頁面,這里每一個圖片顯示在一個對應的頁面)。 代碼中,我們要把相冊的圖片總數給拿到,即上圖“51”,表示最后一張圖片。 它的每一張圖片對應的網頁都是有規律的: http://www.mzitu.com/62728 http://www.mzitu.com/62728/2 ......... http://www.mzitu.com/62728/51 發現了嗎,我們只需要拿到總圖片個數,然后代碼中拼接一下,**生成51個網頁路徑即可**。 然后我們對分別對著51個頁面解析html源代碼,提取出**圖片的路徑** 代碼我已經寫好了,看官們可以訪問代碼倉:[https://github.com/JadenTseng/python-get-girl-image](https://github.com/JadenTseng/python-get-girl-image) 獲取。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看