日常生活中的“炼金术士”


服务器性能的比较是一个复杂的主题,在如何“正确”进行比较方面引起了很多争议。在本文中,我们将讨论处理器进入我们的服务之前的处理方式。

现代服务器由许多组件组成,每个组件都需要使用自己独特的方法。服务器处理器也不例外,这将在后面讨论。

新手


通常,供应商会立即通过标尺发布新的处理器,但是我们很清楚自己想要什么。事情就这样发生了:英特尔最近发布了一个代号为Cascade Lake Refresh的更新。阵容包含14个处理器,但我们仅对其中三个感兴趣:

  • 英特尔®至强®金牌6240R;
  • 英特尔®至强®金牌5218R;
  • 英特尔®至强®银牌4214R。


证明对这些模型的兴趣很容易:我们已经成功使用了它们的前身:

  • 英特尔®至强®银牌4114;
  • 英特尔®至强®银牌4214;
  • 英特尔®至强®金牌6140;
  • 英特尔®至强®金牌6240;
  • 英特尔®至强®金牌5218。

在某些情况下,供应商甚至没有透露名称就发布了全新的产品,并向合作伙伴发送了标有“机密”字样的组件的工程样品​​。


首先,对处理器与可用主板的兼容性进行了测试,因为主板在未知处理器上可能无法正常工作。幸运的是,供应商与主板制造商紧密合作,这使他们可以提前发布BIOS更新,从而增加了对新处理器微代码的支持。由于增加处理器的处理能力会增加散热量,因此在测试过程中我们还要仔细检查散热状况。

在检查了物理性能后,我们根据理论数据编制了一个比较表,然后进行性能比较。
有关英特尔处理器技术规格的数据是公开可用的,并可在资源ark.intel.com上获得。
特性至强®金6140至强®金牌6240至强®金牌6240R
芯数十八十八24
线程数363648
基本频率,GHz2.302.602.40
Turbo Boost模式下的最大频率,GHz3.703.904.00
L3快取大小24.7524.7535.75
UPI行数332
TDP,瓦特140150165
与之前的版本相比,6240R的变化是显而易见的:Turbo Boost模式下的频率增加,更多的内核,更多的缓存,结果是更多的热量。重要的是要注意,与四代系统不同的是,它们的Cascade Lake Refresh处理器不受支持。

现在,您可以开始实际的性能测试。

“重炮”


最初,我们使用著名的SPEC CPU 2017来演示性能差异,而SPEC CPU测试是性能测量领域的事实上的标准。大多数处理器制造商在其演示文稿中均引用使用此测试套件获得的结果。

所有SPEC CPU测试都是根据特定“测试主题”的源代码进行编译的,此外,禁止使用优化编译器,例如Intel C ++编译器(icc)和AMD Optimizing C / C ++编译器(AOCC)。这种方法使您可以利用处理器和相关工具的所有功能来比较不同体系结构的处理器。

SPEC组织允许您在特定页面上发布测试结果我们对带有“ gold”的两路服务器感兴趣。根据我们的要求,我们发现:

  • Xeon®Gold 6240R处理器有38个结果;
  • Xeon®Gold 6240有55个结果;
  • Xeon®Gold 6140的116条结果。

每次测试的中值如下表所示:
测试至强®金6140至强®金牌6240至强®金牌6240R
SPECspeed2017_int_base9.0810.310.3
SPECspeed2017_fp_base110.0132.0149.0
SPECrate2017_int_base197.0230.5274.0
SPECrate2017_fp_base186.0209.5241.0
通过分析处理器的理论数据,我们可以放心地说,我们期望并预测基准测试的增长。

除了SPEC,我们还使用其他易于理解的基准。

简约的方法


并非没有流行的衡量性能的程序,这些程序可能尚未成为标准,但却赢得了一定的声誉。关于PassMark性能测试GeekBench

GeekBench(版本5在发布时是相关的)专门研究处理器性能,并具有开放的评分表,您可以在其中查看自己的结果并与他人进行比较。与SPEC CPU相比,GeekBench除了以整数和浮点数进行计算外,还执行涉及特殊处理器指令的密码计算

实现了三个基于x86_64架构的流行操作系统系列:Windows,Linux和MacOSX。GeekBench也可以在具有ARM架构的设备上运行,但只能在Android和iOS上运行,这排除了在具有该架构的服务器上运行的可能性。

测试结果以相对于标准的点数表示。在GeekBench 5中,选择Intel Core i3-8100作为基准,其结果得出1000分。如果处理器得分2000分,则意味着它的功能是标准处理器的两倍。

我们选择了PassMark PerformanceTest作为GeekBench的替代方案。尽管PerformanceTest仅适用于Windows,但它具有更广泛的配置文件,不仅可以测试CPU,还可以测试系统中的RAM,磁盘和图形加速器(如果有)。

GeekBench和PerformanceTest之间的主要区别是作为可执行文件分发。这种测试类似于封闭源软件,后者只能进行常规优化,不支持新的处理器功能。

表中显示了使用GeekBench 5的测试结果。
指数至强®金牌6240至强®金牌6240R
单核成绩10441089
单核加密分数14421456
单核整数分数9981055
单核浮点分数10771100
多核成绩2620331262
多核加密分数2655426920
多核整数分数2621431639
多核浮点分数2612131170
与SPEC CPU结果相比,GeekBench在整数计算中显示出更明显的差异。但是,级联湖刷新的优势仍然不可否认。

“真实”任务


一些专家对基准性能表示怀疑。 “合成!不重要! ”他们说,并且以自己的方式是对的。 IT公司的专家只在自己的系统中考虑新处理器。同时,不仅要求处理器的处理能力,还要求与RAM和外围设备的交互。

IT领域中使用的软件产品种类繁多,并且每个产品都有许多设置。准备大量的测试花费了无法接受的长时间,并且还使经验丰富的专业人员可以表达对测试配置的不满意。
Selectel LAB项目的框架内,为专家提供了用于测试的新设备,使专家可以针对任何任务进行自己的独立测试。
我们选择了几个任务,这些任务使我们能够评估处理器和整个北方地区的性能。这是清单:

  • 积极优化LLVM项目的编译;
  • 计算π的一百万个小数位;
  • 用ffmpeg重新编码视频。

LLVM项目由许多复杂程序组成,因此,即使在功能强大的服务器上,所有项目程序的编译过程也可以完美并行。在我们的测试中,我们使用SSD作为存储和12个DDR4-2666 RAM裸片。
测试至强®金牌6240至强®金牌6240R
数π的计算3m 20.559秒3m 16.246秒
使用ffmpeg对视频进行转码0m 46.646s0m 46.634s
通过积极的优化来编译LLVM项目1500万35.933s1500万0.370秒
实际测试证实了先前进行的“综合”测试的结果。LLVM项目程序的编译是并行执行的,因此,内核数量的增加可按预期加速该过程。π数的计算仅使用一个线程,在此测试中,您可以看到速度的小幅增加与最大处理器频率的增加有关。

对视频进行重新编码并不是一件容易的事,它是由ffmpeg应用程序本身自行决定并行计算的。处理器之间的细微差别归因于软件功能。

而不是结论


进展不会停滞不前,而对Cascade Lake线的更新是一个备受期待的事件。我们的测试表明,内核数量的增加,三级高速缓存的增加以及时钟频率的提高有利地影响了处理器的整体性能,使其能够充分应对“合成”和接近实际条件的任务。

您现在可以在自己的任务中尝试使用新的处理器-服务器可以在控制面板中订购

All Articles