لماذا يعد OceanStor Dorado V6 التخزين الأسرع والأكثر موثوقية

من فضلك لا تتسرع في الاستنتاجات بسبب العنوان! لدينا حجج قوية لدعمها ، وقمنا بتعبئتها بأكبر قدر ممكن. نلفت انتباهكم إلى منشور حول مفهوم ومبادئ تشغيل نظام تخزين البيانات الجديد ، والذي تم إصداره في يناير 2020.




في رأينا ، يتم توفير الميزة التنافسية الرئيسية لعائلة تخزين Dorado V6 من خلال الأداء والموثوقية المذكورة في الرأس. نعم ، الأمر بسيط للغاية ، ولكن بسبب بعض القرارات الصعبة وغير الصعبة للغاية تمكنا من تحقيق هذا "عادل" ، سنتحدث اليوم.

من أجل الكشف عن إمكانات أنظمة الجيل الجديد بشكل أفضل ، سنتحدث عن كبار الممثلين لمجموعة النماذج (النماذج 8000 ، 18000). ما لم يذكر خلاف ذلك ، فهي ضمنية.



بضع كلمات عن السوق


من أجل فهم أفضل لمكان حلول Huawei في السوق ، ننتقل إلى المقياس المثبت - " الأرباع السحرية " من Gartner. قبل عامين ، في قطاع صفيف الأقراص للأغراض العامة ، دخلت شركتنا بثقة إلى مجموعة القادة ، في المرتبة الثانية بعد NetApp و Hewlett Packard Enterprise. في عام 2018 ، تميز موقع Huawei في سوق التخزين بالحالة الصلبة بحالة "مقدم الطلب" ، ولكن كان هناك شيء مفقود لتحقيق مراكز قيادية.

في عام 2019 ، جمع غارتنر ، في بحثه ، كلا القطاعين أعلاه في قطاع واحد - "التخزين الرئيسي". ونتيجة لذلك ، وجدت Huawei نفسها مرة أخرى في ربع القادة ، بجانب الموردين مثل IBM و Hitachi Vantara و Infinidat.

لإكمال الصورة ، نلاحظ أن جارتنر يجمع 80٪ من البيانات للتحليل في السوق الأمريكية ، وهذا يؤدي إلى تحيز ملحوظ لصالح تلك الشركات الممثلة جيدًا في الولايات المتحدة. في غضون ذلك ، يجد الموردون الذين يستهدفون الأسواق الأوروبية والآسيوية أنفسهم في وضع أقل فائدة بشكل ملحوظ. وعلى الرغم من هذا ، في العام الماضي ، احتلت منتجات Huawei مكانها الصحيح في الربع العلوي الأيمن ، ووفقًا لحكم جارتنر ، "يمكن التوصية باستخدامها".



الميزات الجديدة في Dorado V6


يتم تمثيل خط إنتاج Dorado V6 ، على وجه الخصوص ، من خلال أنظمة مستوى الدخول لسلسلة 3000. وهي مجهزة أصلاً بجهازي تحكم ، ويمكن توسيعها أفقيًا إلى 16 وحدة تحكم و 1200 قرص و 192 جيجابايت من ذاكرة التخزين المؤقت. كما سيتم تجهيز النظام بمنافذ قناة ليفية خارجية (8/16/32 Gb / s) ومنافذ إيثرنت (1/10/25/40/100 Gb / s).

لاحظ أنه يتم التخلص التدريجي من استخدام البروتوكولات التي لم تحقق نجاحًا تجاريًا ، لذلك قررنا في البداية التخلي عن دعم القناة الليفية عبر الإيثرنت (FCoE) و Infiniband (IB). ستتم إضافتها في إصدارات البرامج الثابتة اللاحقة. يتوفر دعم NVMe over Fabric (NVMe-oF) خارج الصندوق أعلى القناة الليفية. من المقرر أن يدعم البرنامج الثابت التالي ، المقرر صدوره في يونيو ، NVMe عبر وضع Ethernet. في رأينا ، ستغطي المجموعة المذكورة أعلاه أكثر من احتياجات معظم عملاء Huawei.

لا يوجد وصول إلى الملف في إصدار البرنامج الثابت الحالي وسيظهر في أحد التحديثات التالية أقرب إلى نهاية العام. يتوقع التنفيذ على المستوى الأصلي ، بواسطة وحدات التحكم نفسها مع منافذ إيثرنت ، دون استخدام معدات إضافية.

الفرق الرئيسي بين سلسلة Dorado V6 3000 والموديلات القديمة هو أنه في الخلفية يدعم بروتوكول واحد - SAS 3.0. وفقًا لذلك ، لا يمكن استخدام محركات الأقراص الموجودة إلا مع الواجهة المسماة. من وجهة نظرنا ، فإن الأداء المقدم يكفي تمامًا لجهاز من هذا النوع.

أنظمة Dorado V6 5000 و 6000 هي حلول متوسطة المدى. كما أنها مصنوعة في عامل الشكل 2U وهي مجهزة بوحدات تحكم. تختلف عن بعضها البعض في الأداء ، وعدد المعالجات ، والحد الأقصى لعدد الأقراص وحجم ذاكرة التخزين المؤقت. ومع ذلك ، في المصطلحات المعمارية والهندسية ، فإن Dorado V6 5000 و 6000 متطابقة وتبدو متشابهة.

تتضمن الفئة العالية أنظمة Dorado V6 من سلسلتي 8000 و 18000. وهي مصممة بأحجام إطارات 4U ، ولديها بشكل افتراضي بنية منفصلة يتم فيها فصل وحدات التحكم ومحركات الأقراص. في الحد الأدنى من التكوين ، يمكن أيضًا تجهيزها بجهازي تحكم فقط ، على الرغم من أن العملاء ، كقاعدة عامة ، يُطلب منهم تثبيت أربعة أو أكثر.

يتم قياس Dorado V6 8000 أفقيًا إلى 16 وحدة تحكم ، و Dorado V6 18000 - إلى 32. تحتوي هذه الأنظمة على معالجات مختلفة مع عدد مختلف من النوى وحجم ذاكرة التخزين المؤقت. لكل ذلك ، يتم الحفاظ على هوية الحلول الهندسية ، كما هو الحال في النماذج المتوسطة.

يتم توصيل أرفف 2U مع محركات الأقراص عبر RDMA بعرض نطاق يبلغ 100 جيجابت / ثانية. تدعم الواجهة الخلفية Dorado V6 الأقدم أيضًا SAS 3.0 ، ولكن في حالة SSDs مع انخفاض مثل هذا في السعر. ثم ستكون هناك جدوى اقتصادية لاستخدامها ، حتى مع الأخذ بعين الاعتبار انخفاض الإنتاجية. في الوقت الحالي ، فإن الفرق في التكلفة بين محركات الأقراص ذات الحالة الصلبة مع واجهات SAS و NVMe صغير جدًا لدرجة أننا لسنا مستعدين للتوصية بهذا الحل.



داخل وحدة التحكم


وحدات تحكم Dorado V6 مصنوعة على قاعدة العناصر الخاصة بنا. لا توجد معالجات Intel ، ولا يوجد Broadcom ASICs. وبالتالي ، يتم إزالة كل مكون من مكونات اللوحة الأم ، بالإضافة إلى نفسه ، تمامًا من تأثير المخاطر المرتبطة بضغط العقوبات من الشركات الأمريكية. لا بد أن أولئك الذين رأوا بأعيننا أي من معداتنا قد لاحظوا الدروع ذات الشريط الأحمر تحت الشعار. هذا يعني أن المنتج يفتقر إلى المكونات الأمريكية. هذه هي الدورة الرسمية لشركة Huawei - الانتقال إلى مكونات إنتاجها الخاص ، أو ، على أي حال ، تصنيعها في البلدان التي لا تتبع سياسة الولايات المتحدة.

إليك ما يمكنك رؤيته على لوحة التحكم نفسها.

  • واجهة شبكة عالمية (رقاقة Hisilicon 1822) ، مسؤولة عن الاتصال بالقناة الليفية أو إيثرنت.
  • BMC-, Hisilicon 1710, . .
  • , ARM Kunpeng 920 Huawei. , , . . . , Dorado V6 .
  • SSD ( Hisilicon 1812e), SAS-, NVMe-. , Huawei SSD, NAND, . , Huawei , .
  • — Ascend 310. , , . , . , .



Kunpeng


معالج Kunpeng هو نظام على شريحة (SoC) ، حيث توجد بالإضافة إلى وحدة الحوسبة وحدات الأجهزة التي تسرع العمليات المختلفة ، مثل حساب الاختبارية أو تنفيذ "تشفير المحو". كما أنها تنفذ دعم الأجهزة لـ SAS و Ethernet و DDR4 (من ست إلى ثماني قنوات) ، إلخ. كل هذا يسمح لهواوي بإنشاء وحدات تحكم تخزين لا تقل في الأداء عن حلول Intel الكلاسيكية.

بالإضافة إلى ذلك ، فإن حلولها الخاصة المستندة إلى بنية ARM تمنح Huawei الفرصة لإنشاء حلول خادم كاملة وتقديمها لعملائها كبديل لـ x86.



العمارة الجديدة لدورادو V6 ...


يتم تمثيل البنية الداخلية لنظام تخزين Dorado V6 الأقدم بأربعة مجالات فرعية (مصانع) رئيسية.

المصنع الأول هو واجهة أمامية مشتركة (واجهات الشبكة المسؤولة عن الاتصال بمصنع SAN أو المضيفين).

والثاني هو مجموعة من وحدات التحكم ، يمكن لكل منها الوصول إلى بطاقة شبكة الواجهة الأمامية بالإضافة إلى المحرك المجاور ، وهو عبارة عن صندوق به أربع وحدات تحكم ، بالإضافة إلى وحدات الطاقة والتبريد المشتركة بينها ، باستخدام بروتوكول RDMA. الآن يمكن تجهيز طرازات Dorado V6 عالية الجودة بمحركين من هذا النوع (على التوالي ، ثماني وحدات تحكم).

المصنع الثالث مسؤول عن الواجهة الخلفية ويتكون من بطاقات شبكة RDMA 100G.

وأخيرًا ، يتم تمثيل المصنع الرابع "بالحديد" برفوف ذكية قابلة للتوصيل بمحركات.

يطلق هذا الهيكل المتناسق العنان للإمكانات الكاملة لتقنية NVMe ويضمن الأداء العالي والموثوقية. تتم موازنة عملية الإدخال / الإخراج إلى أقصى حد عبر المعالجات والنوى ، مما يوفر قراءة وكتابة متزامنة لمؤشرات ترابط متعددة.



... وما أعطتنا


إن الأداء الأقصى لحلول Dorado V6 أعلى بثلاث مرات تقريبًا من أداء أنظمة الجيل السابق (من نفس الفئة) ويمكن أن يصل إلى 20 مليون IOPS.

هذا يرجع إلى حقيقة أنه في الجيل السابق من الأجهزة ، امتد دعم NVMe فقط إلى الرفوف المزودة بمحركات. الآن هو موجود في جميع المراحل ، من المضيف إلى SSD. خضعت شبكة الواجهة الخلفية أيضًا لتغييرات: أفسحت SAS / PCIe المجال لـ RoCEv2 مع عرض نطاق ترددي يبلغ 100 جيجابت / ثانية.

تم تغيير عامل شكل SSD أيضًا. إذا كان هناك في السابق 25 محرك أقراص على الرف 2U ، فقد تم الآن إحضار ما يصل إلى 36 قرصًا فعليًا بحجم كف اليد. بالإضافة إلى ذلك ، الرفوف "أكثر حكمة". يحتوي كل منهم الآن على نظام يتحمل الأخطاء من وحدتي تحكم بناءً على شرائح ARM ، على غرار تلك المثبتة في وحدات التحكم المركزية.



حتى الآن ، لا ينخرطون إلا في إعادة تنظيم البيانات ، ولكن مع إصدار البرامج الثابتة الجديدة ، سيتم إضافة الضغط والحفظ وتشفير المحو إليها ، مما سيقلل الحمل على وحدات التحكم الرئيسية من 15 إلى 5 ٪. يؤدي نقل جزء من المهام إلى الرف في نفس الوقت إلى تحرير النطاق الترددي للشبكة الداخلية. وكل هذا يزيد بشكل كبير من إمكانات النظام للتوسع.

تم تنفيذ الضغط وإلغاء البيانات المكررة في أنظمة تخزين الجيل السابق باستخدام كتل ذات طول ثابت. الآن ، تمت إضافة وضع للعمل مع كتل متغيرة الطول ، والتي تحتاج حتى الآن إلى تمكين بالقوة. قد تغير البرامج الثابتة اللاحقة هذه الحقيقة.

أيضا لفترة وجيزة على التسامح الفشل. ظلت Dorado V3 عاملة إذا فشل أحدهما. سيضمن Dorado V6 توفر البيانات حتى في حالة تعطل سبعة من أصل ثمانية وحدات تحكم أو أربعة "محرك" واحد على التوالي.



الموثوقية الاقتصادية


في الآونة الأخيرة ، بين عملاء Huawei ، تم إجراء استطلاع حول نوع العناصر البسيطة للبنية التحتية لتكنولوجيا المعلومات التي تعتبرها الشركة مقبولة. بالنسبة للجزء الأكبر ، كان المستجيبون متسامحين مع موقف افتراضي لا يستجيب فيه التطبيق لعدة مئات من الثواني. بالنسبة لنظام التشغيل أو مهايئ الناقل المضيف ، كان وقت التعطل الحرج عشرات الثواني (في الواقع ، وقت إعادة التشغيل). يطلب العملاء طلبات أعلى على الشبكة: يجب ألا يختفي عرض النطاق الترددي لأكثر من 10-20 ثانية. كما قد تعتقد ، اعتبر المستجيبون أن إخفاقات التخزين هي الأكثر أهمية. من وجهة نظر ممثلي الأعمال ، يجب ألا يتجاوز نظام التخزين البسيط ... بضع ثوان في السنة!

بمعنى آخر ، إذا لم يستجب تطبيق العميل للبنك لمدة 100 ثانية ، فمن المحتمل ألا يتسبب ذلك في عواقب وخيمة. ولكن إذا لم يعمل نفس العدد من أنظمة التخزين ، فمن المحتمل توقف الأعمال التجارية وخسائر مالية كبيرة.



يوضح الرسم البياني أعلاه تكلفة ساعة العمل لأكبر عشرة بنوك (بيانات فوربس لعام 2017). موافق ، إذا كانت شركتك تقترب من حجم البنوك الصينية ، فإن تبرير الحاجة إلى شراء تخزين لعدة ملايين من الدولارات لن يكون صعبًا. والعكس صحيح أيضًا: إذا لم تتكبد الشركة خسائر كبيرة خلال فترة التوقف ، فمن غير المرجح أن تشتري أنظمة تخزين عالية الجودة. على أي حال ، من المهم أن يكون لديك فكرة عن الحجم الذي تهدد الثقب بتكوينه في محفظتك ، بينما يتعامل مسؤول النظام مع نظام تخزين البيانات الذي رفض العمل.




الفشل الثاني


في الحل A في الرسم التوضيحي أعلاه ، يمكنك التعرف على الجيل السابق لنظام Dorado V3. تعمل أربعة من وحدات التحكم الخاصة بها في أزواج ، وتحتوي وحدتا تحكم فقط على نسخ من ذاكرة التخزين المؤقت. يمكن أن تقوم وحدات التحكم داخل زوج بإعادة توزيع الحمل. في نفس الوقت ، كما ترى ، لا توجد "مصانع" للواجهة الأمامية والخلفية ، لذا فإن كل الرفوف المزودة بمحركات متصلة بزوج وحدة تحكم محدد.

يوضح الرسم البياني للحل B الحل المتاح حاليًا في السوق من بائع آخر (هل اكتشفت؟). توجد بالفعل مصانع أمامية وخلفية ، ومحركات الأقراص متصلة مباشرة بأربع وحدات تحكم. صحيح ، في عمل خوارزميات النظام الداخلي ، هناك فروق دقيقة غير واضحة في التقريب الأول.

على اليمين توجد بنية تخزين Dorado V6 الحالية بكل عناصرها الداخلية. ضع في اعتبارك كيف تعيش هذه الأنظمة حالة نموذجية - فشل وحدة تحكم واحدة.

في الأنظمة الكلاسيكية ، التي تتضمن Dorado V3 ، تصل الفترة المطلوبة لإعادة توزيع الحمل في حالة الفشل إلى أربع ثوانٍ. في هذا الوقت ، يتوقف I / O تمامًا. في الحل B ، من زملائنا ، على الرغم من وجود بنية أكثر حداثة ، فإن فترة التوقف أثناء الفشل أعلى - ست ثوان.

يستعيد تخزين Dorado V6 عملياته بعد ثانية واحدة فقط من الفشل. يتم تحقيق هذه النتيجة بسبب بيئة RDMA الداخلية المتجانسة ، مما يسمح لوحدة التحكم بالوصول إلى الذاكرة "الأجنبية". الظرف المهم الثاني هو وجود مصنع أمامي ، لا يتغير مسار المضيف بسببه. يظل المنفذ كما هو ، ويتم إرسال الحمل ببساطة إلى وحدات التحكم القابلة للصيانة عن طريق برامج التشغيل المتعددة.

يتم تحقيق فشل وحدة التحكم الثانية في Dorado V6 في ثانية واحدة وفقًا لنفس المخطط. يستغرق Dorado V3 حوالي ست ثوانٍ ، بينما يستغرق حل بائع آخر تسعًا. بالنسبة للعديد من نظم إدارة قواعد البيانات (DBMS) ، لم يعد من الممكن اعتبار هذه الفواصل مقبولة ، حيث أنه خلال هذا الوقت ينتقل النظام إلى وضع الاستعداد ويتوقف عن العمل. هذا هو أول شيء يتعلق بنظام DBMS ، والذي يتكون من العديد من الأقسام.

فشل الحل الثالث وحدة تحكم غير قادر على البقاء. لمجرد فقدان الوصول إلى جزء من أقراص البيانات. بدوره ، يستعيد الحل B في مثل هذه الحالة قابلية التشغيل ، الأمر الذي يتطلب ، كما في الحالة السابقة ، تسع ثوان.

ماذا يوجد لدى Dorado V6؟ ثانية واحدة.



ما يمكن القيام به في الثانية


لا شيء تقريبًا ، لكننا لسنا بحاجة إلى ذلك. مرة أخرى ، في فئة Hi-end Dorado V6 ، فإن مصنع الواجهة الأمامية غير مرتبط بمصنع وحدة التحكم. وهذا يعني أنه لا توجد منافذ مشفرة تنتمي إلى وحدة تحكم معينة. لا تعني إعادة بناء الفشل إيجاد مسارات بديلة أو إعادة تهيئة تعدد المسارات. يستمر النظام في العمل كما كان يعمل.



مقاومة متعددة للفشل


طرازات Dorado V6 الأقدم دون أي مشاكل تنجو من الفشل المتزامن لأي من وحدتي تحكم (!) من أي "محرك". أصبح ذلك ممكنًا لأن الحل يخزن الآن ثلاث نسخ من ذاكرة التخزين المؤقت. لذلك ، حتى مع وجود فشل مزدوج ، سيكون هناك دائمًا نسخة كاملة واحدة.

لن يتسبب الفشل المتزامن لجميع وحدات التحكم الأربعة في أحد "المحركات" في حدوث عواقب مميتة ، حيث يتم توزيع النسخ الثلاث من ذاكرة التخزين المؤقت في كل لحظة من الزمن بين "المحركات". يتم مراقبة مراعاة مثل هذا المنطق للعمل من قبل النظام نفسه.

أخيرًا ، السيناريو غير المحتمل جدًا هو الفشل المتسلسل لسبعة من أصل ثماني وحدات تحكم. علاوة على ذلك ، فإن الحد الأدنى للفاصل الزمني المقبول للحفاظ على قابلية التشغيل بين الأعطال الفردية هو 15 دقيقة. خلال هذا الوقت ، يتمكن نظام التخزين من تنفيذ العمليات اللازمة لترحيل ذاكرة التخزين المؤقت.

ستوفر آخر وحدة تحكم على قيد الحياة عملية تخزين البيانات والحفاظ على ذاكرة التخزين المؤقت لمدة خمسة أيام (القيمة الافتراضية ، التي يسهل تغييرها في الإعدادات). بعد ذلك ، سيتم تعطيل ذاكرة التخزين المؤقت ، ولكن سيستمر التخزين.



لا تزعج التحديثات


يسمح لك نظام Dorado V6 OS الجديد بتحديث تخزين نظام التخزين دون إعادة تشغيل وحدات التحكم.

نظام التشغيل ، كما هو الحال في الحلول السابقة ، يعتمد على Linux ، ومع ذلك ، يتم نقل العديد من عمليات التشغيل من kernel إلى وضع المستخدم. معظم الوظائف ، مثل تلك المسؤولة عن إلغاء البيانات المكررة والضغط ، أصبحت الآن شياطين منتظمة تعمل في الخلفية. ونتيجة لذلك ، لتحديث الوحدات الفردية ليست هناك حاجة لتغيير نظام التشغيل بأكمله. لنفترض ، لإضافة دعم لبروتوكول جديد ، ما عليك سوى إيقاف تشغيل وحدة البرنامج المقابلة وبدء بروتوكول جديد.

من الواضح أن قضايا تحديث النظام بأكمله لا تزال قائمة ، بعد كل شيء ، قد تكون هناك عناصر في النواة تحتاج إلى تحديث. ولكن ، وفقًا لملاحظاتنا ، أقل من 6٪ من الإجمالي. هذا يسمح لك بإعادة تشغيل وحدات التحكم عشرات المرات أقل من ذي قبل.



حلول كارثية و HA (HA / DR)


Dorado V6 "جاهز" جاهز للتكامل مع الحلول الموزعة جغرافيًا والمجموعات الحضرية (المترو) ومراكز البيانات "الثلاثية".

على اليسار في الرسم التوضيحي أعلاه توجد مجموعة مترو معروفة بالفعل للكثيرين. يعمل نظاما تخزين في وضع نشط / نشط على مسافة تصل إلى 100 كم عن بعضها البعض. يمكن دعم بنية تحتية مماثلة مع واحد أو أكثر من خوادم النصاب عن طريق حلول من شركات مختلفة ، بما في ذلك نظام التشغيل السحابي FusionSphere. أهمية خاصة في مثل هذه المشاريع هي خصائص القناة بين المواقع ، وجميع المهام الأخرى في حالتنا يتم توليها بواسطة وظيفة HyperMetro ، التي تتوفر ، مرة أخرى ، خارج الصندوق. من الممكن تكامل القناة الليفية وكذلك تكامل iSCSI في شبكات IP إذا دعت الحاجة إلى ذلك. لم تعد هناك حاجة إلى بصريات "مظلمة" مخصصة ، حيث أن النظام قادر على التواصل من خلال القنوات الموجودة.

عند بناء مثل هذه الأنظمة ، فإن متطلبات الأجهزة الوحيدة للتخزين هي تخصيص المنفذ للنسخ المتماثل. يكفي الحصول على ترخيص ، وتشغيل خوادم النصاب - المادي أو الظاهري - وتوفير اتصال IP إلى وحدات التحكم (10 ميجا بت في الثانية ، 50 مللي ثانية).

يسهل نقل هذه البنية إلى نظام به ثلاثة مراكز بيانات (انظر الجانب الأيمن من الرسم التوضيحي). على سبيل المثال ، عندما يعمل مركزان للبيانات في وضع كتلة المترو ، ويستخدم الموقع الثالث ، الموجود على مسافة تزيد عن 100 كم ، النسخ المتزامن غير المتزامن.

يدعم النظام تقنيًا سيناريوهات الأعمال المختلفة التي سيتم تنفيذها في حالة حدوث زيادة كبيرة.



بقاء مترو الكتلة مع الفشل المتعدد


يظهر أعلاه وما يلي أيضًا مجموعة المترو الكلاسيكية ، التي تتكون من نظامي تخزين وخادم النصاب. كما ترى ، في ستة من السيناريوهات التسعة المحتملة للإخفاقات المتعددة ، ستظل بنيتنا التحتية عاملة.

على سبيل المثال ، في السيناريو الثاني ، في حالة فشل خادم النصاب وحدث التزامن بين المواقع ، يظل النظام منتجًا ، حيث يتوقف الموقع الثاني عن العمل. تم تضمين سلوك مماثل بالفعل في الخوارزميات المضمنة.

حتى بعد ثلاثة إخفاقات ، يمكن الحفاظ على الوصول إلى المعلومات إذا كان الفاصل الزمني بينهما 15 ثانية على الأقل.



بطاقة رابحة معتادة من الجلبة


تذكر أن Huawei لا تنتج أنظمة تخزين فحسب ، بل أيضًا مجموعة كاملة من معدات الشبكة. مهما كان موفر التخزين الذي تختاره ، إذا تم استخدام شبكة إدارة الطلب على المياه بين المواقع ، فسيتم بناؤها في 90٪ من الحالات على حلول شركتنا. ينشأ سؤال منطقي: لماذا نجمع حديقة للأنظمة في حين يمكن الحصول على جميع الأجهزة المضمونة المتوافقة مع بعضها البعض من بائع واحد؟



لمسألة الأداء


على الأرجح ، لا يحتاج أحد إلى الاقتناع بأن الانتقال إلى تخزين All-Flash يمكن أن يقلل بشكل كبير من تكاليف صيانة البنية التحتية ، حيث يتم تنفيذ جميع العمليات الروتينية بشكل أسرع عدة مرات. ويدل على ذلك جميع موردي هذه المعدات. وفي الوقت نفسه ، يبدأ العديد من البائعين في التفكك عندما يتعلق الأمر بانخفاض الأداء عند تشغيل أوضاع التخزين المختلفة.

في صناعتنا ، يتم إصدار أنظمة التخزين للتشغيل التجريبي لمدة يوم إلى يومين على نطاق واسع. يجري المزود اختبارًا مدته 20 دقيقة على نظام فارغ ، يتلقى مؤشرات أداء فضائية. وفي التشغيل الفعلي ، تظهر "مكابس تحت الماء" بسرعة. بالفعل بعد يوم ، يتم تقليل قيم IOPS الجميلة بمقدار النصف أو ثلاثة ، وإذا تم ملء التخزين بنسبة 80٪ ، فإنها تكون أقل. عند تشغيل RAID 5 ، بدلاً من RAID 10 ، يتم فقد 10-15٪ أخرى ، وفي وضع كتلة المترو ، ينخفض ​​الأداء إلى النصف.

كل ما سبق ليس حول Dorado V6. يتمتع عملاؤنا بفرصة إجراء اختبار أداء في عطلة نهاية الأسبوع أو على الأقل ليلاً. ثم تظهر مجموعة القمامة نفسها ، ويتضح أيضًا كيف يؤثر تنشيط الخيارات المختلفة - مثل اللقطات والنسخ - على كمية IOPS التي تم تحقيقها.

في Dorado V6 ، لا تؤثر اللقطات و RAID بالتساوي تقريبًا على الأداء (3-5٪ بدلاً من 10-15٪). جمع القمامة (ملء خلايا محرك الأقراص بالأصفار) ، والضغط ، وإلغاء البيانات المكررة في أنظمة التخزين المملوءة بنسبة 80 ٪ ستؤثر دائمًا على السرعة الإجمالية لمعالجة الطلب. لكن Dorado V6 هو المثير للاهتمام في أنه بغض النظر عن مجموعة الوظائف وآليات الحماية التي تقوم بتنشيطها ، فإن الأداء الكلي لنظام التخزين لن يقل عن 80 ٪ من الشكل الذي تم الحصول عليه بدون تحميل.



توزيع الحمل


يتم تحقيق Dorado V6 عالي الأداء من خلال الموازنة في كل مرحلة ، وهي:

  • تعدد
  • استخدام العديد من الاتصالات من مضيف واحد ؛
  • وجود مصنع أمامي ؛
  • بالتوازي مع تشغيل وحدات تحكم التخزين ؛
  • موازنة الحمل عبر جميع محركات الأقراص في RAID 2.0+.

من حيث المبدأ ، هذه ممارسة شائعة. في الوقت الحاضر ، يحتفظ عدد قليل من الأشخاص بكل البيانات على LUN واحدة: يحاول الجميع الحصول على ثمانية ، أو حتى أربعين ، أو أكثر. هذا هو النهج الواضح والصحيح الذي نتشاركه. ولكن إذا كانت مهمتك تتطلب LUN واحدًا فقط ، وهو أسهل في الصيانة ، يمكن لحلولنا المعمارية أن تحقق عليها 80٪ من الأداء المتوفر عند استخدام LUNs متعددة.



جدولة تحميل المعالج الديناميكي


يتم تنفيذ توزيع الحمل على المعالجات عند استخدام LUN واحد على النحو التالي: يتم تقسيم المهام على مستوى LUN إلى "شظايا" صغيرة منفصلة ، يتم تعيين كل منها بشكل صارم إلى وحدة تحكم محددة في "المحرك". يتم ذلك حتى لا يفقد النظام الأداء أثناء "القفز" بهذه القطعة من البيانات على وحدات تحكم مختلفة.

هناك آلية أخرى للحفاظ على الأداء العالي وهي التسلسل الديناميكي ، حيث يمكن تخصيص نوى المعالج لتجمعات المهام المختلفة. على سبيل المثال ، إذا كان النظام خاملاً الآن عند مستوى إلغاء البيانات المكررة والضغط ، فقد يتم تضمين بعض النوى في عملية خدمة الإدخال / الإخراج. أو العكس. كل هذا يتم تلقائيًا وشفافية للمستخدم.

لا يتم عرض البيانات المتعلقة بالتحميل الحالي لكل من نوى Dorado V6 في الواجهة الرسومية ، ولكن من خلال سطر الأوامر ، يمكنك الوصول إلى نظام تشغيل وحدة التحكم واستخدام الأمر العلوي المعتاد في Linux .



دعم NVMe و RoCE


كما ذكرنا من قبل ، في الوقت الحالي تدعم Dorado V6 بشكل كامل NVMe عبر القناة الليفية خارج الصندوق ولا تتطلب أي تراخيص. دعم منتصف العام لـ NVMe عبر Ethernet. لاستخدامه بالكامل ، ستحتاج إلى دعم Ethernet مع الإصدار 2.0 من الوصول المباشر للذاكرة (DMA) من نظام التخزين نفسه ، ومن جانب المحولات ومحولات الشبكة. على سبيل المثال ، مثل Mellanox ConnectX-4 أو ConnectX-5. يمكنك استخدام بطاقات الشبكة المصنوعة على أساس دوائرنا الدقيقة. كما يجب تنفيذ دعم RoCE على مستوى نظام التشغيل.

بشكل عام ، نعتبر Dorado V6 نظامًا موجهًا لـ NVMe. على الرغم من الدعم الحالي للقناة الليفية و iSCSI ، فمن المخطط التحول إلى إيثرنت عالي السرعة باستخدام RDMA في المستقبل.




قليل من التسويق


نظرًا لحقيقة أن نظام Dorado V6 شديد المقاومة للفشل ، ويتطور بشكل جيد ، ويدعم تقنيات الترحيل المختلفة ، وما إلى ذلك ، يتجلى الأثر الاقتصادي لاقتناءه مع بدء التشغيل المكثف لأنظمة التخزين. سنستمر في محاولة جعل ملكية النظام مربحة قدر الإمكان ، حتى لو لم تكن مذهلة في المرحلة الأولى.

على وجه الخصوص ، قمنا بتشكيل برنامج FLASH EVER المتعلق بتمديد دورة حياة التخزين ومصممة لتفريغ العميل قدر الإمكان أثناء الترقيات.



يتضمن هذا البرنامج عددًا من الإجراءات:

  • ( Dorado V6 hi-end);
  • ( Dorado );
  • ( Dorado).



يبقى أن نلاحظ أن الوضع الصعب في العالم لم يكن له تأثير يذكر على الآفاق التجارية للنظام الجديد. على الرغم من حقيقة أن الإصدار الرسمي لـ Dorado V6 لم يحدث إلا في يناير ، إلا أننا نرى طلبًا كبيرًا عليه في الصين ، بالإضافة إلى اهتمام كبير به من الشركاء الروس والدوليين من القطاع المالي والوكالات الحكومية.

من بين أمور أخرى ، فيما يتعلق بالوباء ، بغض النظر عن المدة التي تستغرقها ، فإن مسألة تزويد الموظفين البعيدين بأجهزة سطح مكتب افتراضية حادة بشكل خاص. في هذه العملية ، يمكن لـ Dorado V6 أيضًا إزالة العديد من الأسئلة. للقيام بذلك ، نحن نبذل كل الجهود اللازمة ، بما في ذلك الموافقة عمليا على تضمين النظام الجديد في قائمة التوافق VMware.

***


بالمناسبة ، لا تنسى العديد من ندواتنا عبر الإنترنت ، التي تعقد ليس فقط في قسم اللغة الروسية ، ولكن أيضًا على المستوى العالمي. قائمة الندوات عبر الإنترنت لشهر أبريل متاحة هنا .

All Articles