Melampaui Hukum Moore

Rumor tentang kematian hukum Moore sejauh yang saya ingat. Diskusi bahwa kita mendekati ukuran atom dan bahwa segera seluruh gagasan akan menjadi tidak menguntungkan, saya mendengar 30, dan 20, dan 10 tahun yang lalu. Berikut ini hanya insinyur yang berulang kali membantah mereka. Itu adalah rekayasa genius yang menjadikan hukum Moore salah satu dari "ramalan yang terpenuhi dengan sendirinya."

Saya tidak akan berbicara tentang apakah teknologi telah mencapai batasnya atau tidak. Meskipun pendidikan radiofisika, saya memahaminya dengan sangat kondisional. Mereka yang ingin mempelajari dapat menyarankan Anda untuk berkonsultasi dengan ulasan terbaru . Saya akan mendukung sudut pandang pemikir lain yang sangat dihormati, Bob Colwell .

gambar

Sementara itu, pembuat chip terus membangun (baik, atau setidaknya mengumumkan) pabrik baru yang bekerja pada teknologi baru. Jadi ini masih bermanfaat. Bagi saya, "pasien lebih mungkin hidup daripada mati." Ekspansi Murovskaya akan berhenti ketika server dengan dua prosesor yang diproduksi menggunakan teknologi baru menjadi lebih mahal daripada server dengan 4 yang diproduksi menggunakan yang lama. Dan ini jauh dari kasus. Saya telah bekerja dengan 4-kepala dan bahkan 8-kepala. Tapi mereka berkumpul untuk memesan dan berdiri seperti pesawat kecil.

Tugas saya hari ini adalah berbicara tentang bagaimana teknologi mempengaruhi arsitektur dan pemrograman. Tentang apa yang menanti kita "di sisi lain dari hukum Moore." Sebab banyak tren sudah jelas sekarang. Begitu.

Luas (volume) kristal sebanding dengan bobotnya dalam emas. Transistor berhenti "menyusut", dan ukuran chip terbatas . Dengan demikian, jumlah elemen memiliki batas. Fantasi baru semakin sulit untuk didorong ke kristal. Sebaliknya, harga kekompakan meningkat. Desainer jauh lebih mementingkan optimasi daripada inovasi. Dengan demikian, kita akan melihat semakin sedikit inovasi pada chip CPU atau GPGPU. Mungkin bahkan perangkat lunak harus ditulis ulang lebih sedikit, meskipun saya tidak percaya pada yang terakhir.

Diskresi. Karena ukuran, fungsionalitas, dan konsumsi daya chip terbatas, mari kita tetapkan sebanyak mungkin chip. Bagus dan berbeda (ledakan pertumbuhan akselerator diprediksi oleh Colwell). Atau sama (multi-pemrosesan simetris). Atau umumnya dengan logika yang dapat diprogram ulang (FPGA). Setiap skenario ini memiliki kelebihannya masing-masing. Yang pertama memberikan kinerja maksimum per watt untuk tugas tertentu. Yang kedua adalah kemudahan pemrograman. Yang ketiga adalah fleksibilitas. Skenario apa yang sedang dilaksanakan - waktu akan memutuskan. Seperti yang saya suka katakan, hidup akan menunjukkan segalanya dan menghakimi semua orang. Dan tidak lama menunggu.

Komplikasi NUMA: Kristal tunggal mati, memberi jalan pada chiplet. Dengan demikian, produsen meningkatkan hasil produk. Omong-omong, yalda (hasil) adalah persentase dari chip yang cocok, ini adalah rahasia terburuk dari setiap pembuat chip. Terutama pada tahap awal proses. Tetapi β€œperekatan” kepingan dari kepingan-kepingan ini membawa kesulitan tambahan bagi programmer. Waktu komunikasi antara inti di dalam chiplet dan luar berbeda. Dan ini hanyalah salah satu contoh dari struktur NUMA (Non-Uniform Memory Access) yang semakin kompleks. Yang lainnya adalah topologi dari koneksi di dalam chip. (A - Memory Bandwidth Tinggi. A lebih - diskret. A - lebih ...) Dan semua ini perlu diperhitungkan.

Meningkatnya peran uncore:Karena kita berbicara tentang komunikasi intraprosesor, saya akan menyebutkan tren menarik lainnya. Jika Anda mencermati aktivitas M&A para pemimpin pasar, mudah dipahami bahwa semua raksasa melakukan hal yang sama. Intel berinvestasi dalam teknologi Silicon Photonics dan membeli Barefoot Networks . NVidia bertanggung jawab atas pembelian Mellanox . Dan bukan Infinibanda hanya untuk satu kepentingan. Semua orang mengerti bahwa medan pertempuran di masa depan adalah koneksi intra dan inter-prosesor. Dan siapa yang akan menjadi "raja bukit" tidak akan ditentukan oleh set instruksi atau semacam logika kompleks, tetapi oleh bus dan saklar.

"Orisinalitas" (lebih tepatnya, tidak dapat diulang):Terkadang saya harus bekerja dengan ansambel chip yang besar. Ini terjadi ketika cluster baru untuk komputasi kinerja tinggi dibangun dan diluncurkan. Dan baru-baru ini, saya memperhatikan satu hal yang menarik. Jika chip sebelumnya dengan label yang sama hampir tidak bisa dibedakan, sekarang masing-masing memiliki "karakter" dan "suasana hati" sendiri. Prosesor ini memiliki mekanisme manajemen daya bawaan. Tergantung pada berapa banyak core yang sedang berjalan, blok mana yang terlibat, pada suhu, dll., Dll. Dan tampaknya bagaimana prosesor mengkonsumsi dan menghilangkan energi juga tergantung pada kondisi produksi batch tertentu, pada posisinya di rak dan pada massa faktor tak terkendali lainnya. Sebagai hasilnya, saya mengamati penyimpangan frekuensi (dan kinerja) ~ 15%. Tentu saja, ini mengarah pada semua jenis ketidakseimbangan (MPI, OpenMP).Dan bagaimana menghadapinya belum jelas. Kecuali, untuk melakukan distribusi pekerjaan yang dinamis.

Dan yang terakhir adalah frekuensinya: Pasti tidak akan ada pertumbuhan. Karena berbagai alasan, termasuk konsumsi daya, ukuran, dll. Saya berani menyarankan bahwa frekuensi secara umum harus diturunkan. Dengan cara yang paling tidak menyakitkan untuk kinerja thread tunggal (yaitu, meningkatkan arsitektur). Di sini, tentu saja, Linpack, yang dicintai oleh semua pemasar, akan menderita. Tetapi sistem akan menjadi lebih seimbang dan pekerjaan pengembang besi akan difasilitasi. Nah, dalam aplikasi nyata, semakin sedikit siklus ambang prosesor, menunggu data dari perangkat lambat (memori, grid, disk) - semakin baik.

Ini adalah bagaimana dunia komputer bagi saya di era pasca-tegalan.
Bagaimana Anda melihatnya?

All Articles