<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                企業??AI智能體構建引擎,智能編排和調試,一鍵部署,支持知識庫和私有化部署方案 廣告
                [返回目錄](index.html)#### [使用](sy_index.html) —— [內容](neirong.html) —— [采集管理](#) ##### 一、簡介 文章的采集功能是通過程序來遠程獲取目標網頁內容,經過本地規則解析處理后存儲到服務器的數據庫內。 文章采集系統顛覆傳統采集模式和流程,采集規則與采集界面分離,規則設置更簡單,只需有基礎技術知識的人員設置好相關規則。 編輯人員無需了解太過細節的技 術規則,只需選中自己想要采集的文章列表,就可以像發布文章一樣,輕松地完成數據采集操作。 ##### 二、功能演示 > 一、采集流程 簡單的講有三個步驟: 1、添加采集點,填寫采集規則。 2、采集網址,采集內容 3、發布內容到指定欄目 > 以采集新浪新聞(http://roll.news.sina.com.cn/news/gjxw/gjmtjj/index.shtml)為例,作一下詳細流程介紹。 > 實例說明: 目標:采集新浪新聞到V9系統 “國內” 欄目中。 目標網址:http://roll.news.sina.com.cn/news/gjxw/gjmtjj/index.shtml 1、添加采集點 2. 網址規則配置 > > **1. 添加采集點,填寫采集規則** > > ![](https://img.kancloud.cn/61/e3/61e3353401fa2de49ca08997c2b0889a_797x729.png) > > **A.內容規則** > > ![](https://img.kancloud.cn/03/0a/030aa92a43113d4365d91f3a287b92a1_784x723.png) > > *注:上圖的“目標網頁源碼”是指:目標網頁的源代碼。具體步驟如下: > 目標網頁——>右鍵——>查看源代碼——>找到你要采集的源代碼開始和結束,按“上圖”填寫規則。* > > 添加成功后,測試你的網址采集規則是否正確,如下圖所示: > > ![](https://img.kancloud.cn/a5/90/a590a88e9e4b1e8db232f8ee24790149_855x562.png) > > **B.內容規則配置** > > 為了便于說明,我們只采集標題、內容兩個字段。 > 采集內容網址:http://news.sina.com.cn/w/2010-12-01/135121565455.shtml 的內容采集規則,請你打開這個網址,然后頁面空白處右鍵->查看源文件搜索標題和內容的開始邊界。 > > **標題采集配置:** 從網頁<title></title>里取標題,并去除不需要的字符。如下圖 > > ![](https://img.kancloud.cn/cb/35/cb3501249f93756dd4f094fa81a4f9e7_1068x173.png) > > **內容采集配置:** 新浪新聞最終頁,新聞內容都包含在 \<!-- 正文內容 begin --> <!-- 正文內容 end --> 之間,而且這二個結點,在整個頁面源代碼中具有唯一性。所以可以以此為規則取內容。并對內容進行過濾。如下圖 > > ![](https://img.kancloud.cn/38/ec/38ec2fc3dc6388fbe3cf6ce8d4e7ed2b_1239x152.png) > > **C.自定義規則** > > 除系統自帶的規則外,可根據自己需求進行自定義規則采集。操作和系統規則相同,如下圖: > > ![](https://img.kancloud.cn/0c/1e/0c1e7b403d2a8a340f22d1a805b42249_1260x304.png) > > **D.高級配置** > > 可設置是否把圖片下載到服務器上,是否打水印等配置。如下圖所示: > > ![](https://img.kancloud.cn/40/8e/408e8ac0890d6ecd15ecdac33adec2dd_396x232.png) > > **2. 采集管理** > > 添加采集點測試成功后,你可以管理你添加的采集點(采集網址,采集內容,內容發布,測試,修改,復制,導出).如下圖所示: > > ![](https://img.kancloud.cn/dd/f5/ddf5d70ca9c9a428a9aaed190c9f4b6a_802x185.png) > > **A.采集網址** > > 采集采集點的網址。 > > **B.采集內容** > > 采集采集點的內容。 > > **C.內容發布** > > 將采集的內容發布到指定欄目中。如下圖所示: > > ![](https://img.kancloud.cn/b1/ac/b1ac522774407c1b6ec807a045607bea_792x546.png) > > 點擊“導入”,跳轉到選擇欄目頁面。如下圖所示: > > ![](https://img.kancloud.cn/5e/73/5e737c355f4a8a635d0ab920a4cd1da5_722x229.png) > > 點擊“提交后”,跳轉到欄目配置設置頁面。如下圖所示: > > ![](https://img.kancloud.cn/ea/b3/eab306c7ce7bc70d621992638fe10601_798x169.png) > ![](https://img.kancloud.cn/7a/6d/7a6d7469544d9be7644a3d803733754d_799x265.png) > > 提交成功將采集內容導入到指定欄目(如下圖所示)。在此期間請耐心等待, 完成后會自動轉向。至此一個簡單的采集流程就操作完成。在指定的欄目下已經存在你采集的內容信息。 > > ![](https://img.kancloud.cn/62/34/62347f24cd0a46a69701df816d0a2c7e_861x202.png) [返回目錄](index.html) 上海盛大網絡發展有限公司 c 2006 - 2011 B2-20040053. 問題和建議請反饋至:<http://bbs.phpcms.cn>
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看