利用 Spark 進行數據分析和性能改進
作者:佚名
Spark 是一種前景無限的大數據分析解決方案,專為使用內存處理的高效集群計算而開發。其目標使用模型包括整合了迭代式算法的模型(也就是說,能夠受益于將數據保留在內存之中,而非將其推送到楊恩較高的文件系統的模型)。 在動手嘗試這些練習之前,請務必理解 Spark 的集群計算方法及其與 Hadoop 的不同之處。請閱讀最近發表的一篇相關文章 Spark,一種快速數據分析替代方案,以便了解 Spark 的背景知識和使用方法。
責任編輯:凌云
來源:
IBMDW

























