英特尔® 傲腾? 长期内存是Intel在2019年宣布的一款革命性的产品,英特尔® 傲腾? 长期内存是一种全新的内存类型,其架构设计旨在从数据中心中罗致更多价值,重构数据中心内存/存储条理结构。差别于古板的DRAM,英特尔® 傲腾? 长期内存集大容量、经济性和长期性于一身,能够支持数据中心多个应用场景。K8凯发·国际官方网站基于英特尔® 傲腾? 长期内存做了大宗的应用场景解决计划,笼罩大数据剖析、数据库、云与虚拟化、漫衍式存储等应用场景。为了资助用户通过越发无邪的架构来实现立异型的应用,助力企业实现性能突破,K8凯发·国际官方网站宣布了基于英特尔® 傲腾? 长期内存手艺的Spark应用计划。
由于介质、手艺等缘故原由限制,在现有的手艺条件下古板 DRAM 内保存容量与本钱上很难实现质的突破,以是,寻找立异的存储介质与架构也就成为了 Spark 系统性能扩展的主要偏向。在较量英特尔® 傲腾? 长期内存与 DRAM 内存之后,K8凯发·国际官方网站决议实验接纳英特尔® 傲腾? 长期内存来举行 Spark 内存池扩展。
K8凯发·国际官方网站选择英特尔® 傲腾? 长期内存的缘故原由不难明确。首先,英特尔® 傲腾? 长期内存提供了行业领先的高吞吐率、低延时、高服务质量和超高的耐用性,可以提供靠近内存的延迟,并支持快速缓存和快速存储,对应用举行加速。
其次,英特尔® 傲腾? 长期内存的单装备容量抵达512GB ,远超DRAM 内存的128GB,这使得其可以将系统内存扩展至6TB(不包括系统自身内存)。并且,英特尔® 傲腾? 内存的单位容量价钱要远低于DRAM 内存,这些特征支持企业在数据中心安排更大、更经济的数据集,在大型内存池中获得新的洞察。
在本计划中,K8凯发·国际官方网站使用英特尔® 傲腾? 内存作为 Spark 系统的存储介质,以解决服务器内存缺乏的问题。英特尔® 傲腾? 内存有App Direct 模式和内存模式两种模式。本次测试接纳App Direct 模式 ,App Direct 具有数据长期化、高容量、高可用性、显著加速存储速率等特点,是现在英特尔® 傲腾? 内存主要使用模式(两种计划的对好比图1所示)。
图1
为了验证英特尔® 傲腾? 长期内存的使用关于 Spark 系统性能的影响,K8凯发·国际官方网站基于英特尔® 傲腾? 内存与 DRAM 内存,并划分针对Spark SQL测试与Spark K-Means测试设置了对例如案(接纳相同的硬件设置和组网方法),两套计划的成内情当,因此可以直观的反应出两套计划的性能价钱比。
图2
首先举行的是 Spark SQL 单机测试(测试效果如图3)与集群测试(测试效果如图4)可以发明,英特尔® 傲腾? 内存计划的单机性能是DRAM计划的7.33倍,集群性能是 DRAM 计划的6.05倍。
图3
图4
接下来K8凯发·国际官方网站举行了 Spark K-Means单机测试(测试效果如图5)与集群测试(测试效果如图6)。测试效果显示,在单机情形下,英特尔® 傲腾? 内存计划在训练方面的性能是DRAM计划的13.74倍,整体性能是DRAM计划的3.93倍;集群情形下,英特尔® 傲腾? 内存计划在训练方面的性能是DRAM计划的10.76倍,整体性能是 DRAM 计划的3.99倍。
图5
图6
效果:英特尔® 傲腾? 内存显著提升 Spark 计划性能与本钱效益
以上测试显示,在 Spark 系统的构建历程中,若是需要处置惩罚的数据量高于服务器内存资源,那么基于英特尔® 傲腾? 长期内存的设置计划性能将远超 DRAM 内存计划。这是由于凌驾服务器内存池容纳能力的数据会落在低速的磁盘上,从而导致处置惩罚速率的降低,而英特尔® 傲腾? 内存不但可以提供速率靠近 DRAM 内存的快速存储器,并且可支持的内存池总容量远超 DRAM 内存,这能够让 Spark 缓存更多的数据,从而充分验展 Spark 的数据高速处置惩罚优势。
尤为主要的是,英特尔® 傲腾? 内保存单位本钱上显著低于 DRAM 内存,这能够资助企业有用控制Spark 系统的TCO。在大型的 Spark 应用实践中,英特尔® 傲腾? 内存作为内存扩展计划,可以资助企业在牢靠的性能目的下,有用控制服务器节点数目以及内存采购本钱,从而实现性能与本钱效益的平衡。