超越摩尔定律

据我所知,关于摩尔定律之谣言传得沸沸扬扬。我听说30、20和10年前的讨论是,我们正在接近原子的规模,不久整个想法将无利可图。这里只是工程师一遍又一遍地驳斥他们。正是工程天才使摩尔定律成为“自我实现的预言”之一。

我不会谈论技术是否已达到极限。尽管进行了放射物理教育,但我非常有条件地了解它。那些希望深入研究的人可以建议您查阅最近的评论。我将赞同另一个非常受人尊敬的思想家鲍勃·科威尔的观点

图片

同时,芯片制造商继续建立(或至少宣布)采用新技术的新工厂。因此,这仍然是有益的。对我来说,“病人比死还活着。”当使用新技术制造的具有两个处理器的服务器比使用旧技术制造的具有4个处理器的服务器昂贵时,Murovskaya扩展将停止。事实并非如此。我曾经使用4头甚至8头。但是它们是按顺序组装的,像小飞机一样站立。

我今天的任务是讨论技术如何影响体系结构和编程。关于等待我们的“摩尔定律的另一面”。对于许多趋势而言,现在很明显。所以。

晶体的面积(体积)值得以金计。晶体管停止“缩小”,并且芯片尺寸受到限制。因此,元件的数量具有限制。新的幻想越来越难推到水晶上。相反,紧凑的价格增加。设计师更关注优化而不是创新。因此,我们将在CPU或GPGPU芯片上看到越来越少的创新。也许连软件都不必重写,尽管我不相信后者。

谨慎。由于芯片的大小,功能和功耗受到限制,因此让我们尽可能多地粘贴芯片。良好且不同(Colwell预测的加速剂爆炸性增长)。还是一样的(对称多重处理)。或通常带有可重编程逻辑(FPGA)。这些方案中的每一个都有其优点。第一个给出了特定任务的每瓦最大性能。第二是易于编程。第三是灵活性。正在实施哪种方案-时间将决定。正如我想说的那样,生活将显示一切并审判每个人。等待时间不长。

NUMA的复杂性:单晶消失,由小芯片取代。因此,制造商提高了产品的产量。顺便说一句,yalda(产量)是合适芯片的百分比,这是所有芯片制造商中最糟糕的秘密。特别是在该过程的早期。但是,这种将芯片从各个部分“胶合”的方式给程序员带来了额外的困难。小芯片内部和外部内核之间的通信时间不同。这只是一个日益复杂的NUMA(非统一内存访问)结构的例子。另一个是芯片内部连接的拓扑结构(更多-高带宽内存。更多-离散性。A-更多...),所有这些都需要考虑在内。

Uncore的作用越来越大:由于我们正在谈论处理器内通信,因此我将提及另一个有趣的趋势。如果仔细观察市场领导者的并购活动,很容易理解所有巨头都在做同一件事。英特尔投资了硅光子技术,并收购了Barefoot Networks。 NVidia负责购买Mellanox。而不是Infinibanda的缘故。每个人都知道,未来之战的领域是处理器内和处理器间的连接。谁将成为“山丘之王”,将不取决于指令集或某种复杂的逻辑,而取决于总线和交换机。

“原创性”(更确切地说,是不可重复性):有时我需要处理大量的芯片。当构建并启动用于高性能计算的新群集时,就会发生这种情况。最近,我注意到了一件有趣的事情。如果以前带有相同标签的芯片几乎无法区分,那么现在每个芯片都有自己的“字符”和“心情”。处理器具有内置的电源管理机制。这取决于当前正在运行的内核数量,涉及的模块,温度等。看来,处理器如何消耗和耗散能量还取决于特定批次的生产条件,其在机架中的位置以及其他不受控制的因素的数量。结果,我观察到〜15%的频率偏差(和性能)。当然,这会导致各种不平衡(MPI,OpenMP)。以及如何处理它们还不是很清楚。除非做动态分配工作。

最后一个是频率:绝对不会有任何增长。由于许多原因,包括功耗,大小等。我大胆地建议应该降低频率。以最轻松的方式实现单线程性能(即改进体系结构)。当然,在这里,所有营销人员所钟爱的Linpack将会遭受损失。但是系统将变得更加平衡,并且将促进铁的开发人员的工作。好吧,在实际应用中,处理器脱粒的等待周期越少,等待来自慢速设备(内存,网格,磁盘)的数据就越好。

在后沼泽时代,计算机世界在我看来就是这样。
你怎么看他?

All Articles