楼主:
minisung (糸守町口嚼酱油酿造大师)
2018-05-04 15:31:57https://i.imgur.com/SW8iFCS.png
Apache Spark是一个开源丛集运算框架,最初是由加州大学柏克莱分校AMPLab所开发。相
对于Hadoop的MapReduce会在执行完工作后将中介资料存放到磁盘中,Spark使用了内存
内运算技术,能在资料尚未写入硬盘时即在内存内分析运算。Spark在内存内执行程
式的运算速度能做到比Hadoop MapReduce的运算速度快上100倍,即便是执行程式于硬盘
时,Spark也能快上10倍速度。Spark允许用户将资料加载至丛集内存,并多次对其
进行查询,非常适合用于机器学习算法。