<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ThinkChat2.0新版上線,更智能更精彩,支持會話、畫圖、視頻、閱讀、搜索等,送10W Token,即刻開啟你的AI之旅 廣告
                ### RDD實現詳解 RDD時Spark最基本的數據抽象 - 具備像MapReduce等數據流模型的容錯性 - 并且允許開發人員在大型集群上執行基于內存的計算。 現有的數據流系統對兩種應用的處理并不高效 - 迭代式算法(圖應用和機器學習領域) - 交互式數據挖掘工具 這兩種情況下,將數據保存在內存中能夠極大的提高性能。 為了有效的實現容錯,RDD提供了一種高度受限的共享內存,即RDD是只讀的,并且只能通過其他RDD上的批量操作來創建。 > 上面說的有些抽象哦,下面再詳細介紹吧 Spark的目標是為了基于工作集的應用(即多個并行操作重用中間結果的應用)提供抽象。 #### 1. 什么是RDD 制度的、分區記錄的集合。RDD只能基于在穩定物理存儲中的數據集和其他已有的RDD上執行確定性操作來創建。 > RDD的創建 - 由一個已經存在的Scala集合創建 - 由外部存儲系統的數據集創建,包括本地的文件系統,還有所有Hadoop支持的數據集,比如HDFS、HBase RDD創建后,就可以在RDD上進行數據處理。 RDD支持兩種操作: - 轉換(trans-formation):即從現有的數據集創建一個新的數據集 - 動作(action):即在數據集上進行計算后,返回一個值給Driver程序。 > RDD支持的轉換: map、filter、flatMap、mapParttions、sample #### 2. RDD的轉換和DAG的生成 [Spark 在反作弊聚類場景的實踐](https://blog.csdn.net/huangshulang1234/article/details/78828499) [利用spark做文本聚類分析](https://blog.csdn.net/qq_30843221/article/details/54909788) ifast [知乎-該如何做大中型 UGC 平臺(如新浪微博)的反垃圾(anti-spam)工作?](https://www.zhihu.com/question/20103086) [Facebook 是怎么做反垃圾信息的 (antispam)? 都有哪些可取之處?](https://www.zhihu.com/question/29814056) [知乎-反垃圾(Anti-Spam)](https://www.zhihu.com/topic/19570555/hot) [反垃圾中的文本相似度對比是怎么做的?](https://www.zhihu.com/question/23945183)
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看