apache spark指的是什么

发布时间:2024-02-17
建站服务器
这篇文章给大家分享的是有关apache spark指的是什么的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。
apache spark是一个开源集群运算框架,最初是由加州大学柏克莱分校amplab所开发。相对于hadoop的mapreduce会在运行完工作后将中介数据存放到磁盘中,spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。
spark在存储器内运行程序的运算速度能做到比hadoop mapreduce的运算速度快上100倍,即便是运行程序于硬盘时,spark也能快上10倍速度。spark允许用户将数据加载至集群存储器,并多次对其进行查询,非常适合用于机器学习算法。
使用spark需要搭配集群管理员和分布式存储系统。spark支持独立模式(本地spark集群)、hadoop yarn或apache mesos的集群管理。
在分布式存储方面,spark可以和hdfs、 cassandra、openstack swift和amazon s3等接口搭载。 spark也支持伪分布式(pseudo-distributed)本地模式,不过通常只用于开发或测试时以本机文件系统取代分布式存储系统。在这样的情况下,spark仅在一台机器上使用每个cpu核心运行程序。
在2014年有超过465位贡献家投入spark开发,让其成为apache软件基金会以及大数据众多开源项目中最为活跃的项目。
感谢各位的阅读!关于apache spark指的是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到吧!
上一个:电脑输入法打不了字怎么回事(电脑输入法突然不能打字)
下一个:vivoy73s性价比怎么样(vivoy73s手机性能怎么样)

各种测量值及误差的区别
华为手机怎么装YouTube(华为手机怎么装第二个微信)
丰兴toyooki齿轮泵维修常识
accuplace公司的高精度压力表在工业生产中的应用
超微量分光光度计广泛应用
笔记本固态硬盘是c盘还是d盘,电脑的固态硬盘是C盘和d盘加起来256吗
房地产契税是什么意思,房产契税退税政策
借条过期5年还能胜诉吗
石榴盆景明艳动人
差压流量计发展和应用状况