نائب الرئيس السريع في تخزين الوحدة: كيف يعمل

سنتحدث اليوم عن تقنية مثيرة للاهتمام يتم تطبيقها في أنظمة تخزين Unity / Unity XT - FAST VP. إذا سمعت لأول مرة عن الوحدة ، فعندئذٍ يمكنك التعرف في نهاية المقالة على خصائص النظام. كجزء من فريق مشروع Dell EMC ، أعمل على نائب الرئيس FAST لأكثر من عام. أريد اليوم أن أتحدث أكثر عن هذه التكنولوجيا وأكشف عن بعض تفاصيل تنفيذها. بالطبع ، فقط أولئك المسموح لهم بالكشف. إذا كنت مهتمًا بقضايا تخزين البيانات بكفاءة أو لم تكتشف تمامًا الوثائق ، فستكون هذه المقالة مفيدة ومثيرة للاهتمام بالتأكيد.



يجب أن أقول على الفور حول ما لن يكون في المواد. لن يكون هناك بحث عن المنافسين والمقارنات معهم. كما أنني لا أخطط للحديث عن تقنيات مشابهة من مصادر مفتوحة ، لأن قارئًا غريبًا يعرفها بالفعل. وبالطبع ، لن أعلن عن أي شيء.

تخزين Tiering. أهداف وغايات FAST VP


يشير FAST VP إلى Tiering التخزين المؤتمت بالكامل للتجمع الظاهري. هل هو معقد؟ لا شيء ، الآن سنكتشف ذلك. Tiering هي طريقة لتنظيم تخزين البيانات ، حيث توجد مستويات (طبقات) متعددة حيث يتم تخزين هذه البيانات. لكل منها خصائصه الخاصة. الأهم: أداء وحدة تخزين وحجمها وتكلفة تخزينها. بالطبع ، هناك علاقة بينهما.

تتمثل إحدى السمات الهامة في وضع الطبقات في أن الوصول إلى البيانات يتم توفيره بشكل موحد ، بغض النظر عن مستوى التخزين الموجود حاليًا ، وحجم التجمع يساوي مجموع أحجام الموارد المضمنة فيه. هنا يكمن الاختلاف عن ذاكرة التخزين المؤقت: لا تتم إضافة حجم ذاكرة التخزين المؤقت إلى إجمالي كمية المورد (التجمع في هذه الحالة) ، وستقوم بيانات ذاكرة التخزين المؤقت بتكرار بعض البيانات على الوسيط الرئيسي (أو ستتكرر إذا لم تتم كتابة البيانات من ذاكرة التخزين المؤقت بعد). أيضا ، يتم إخفاء توزيع البيانات حسب المستويات من المستخدم. أي أنه لا يرى أي نوع من البيانات موجود على كل مستوى ، على الرغم من أنه يمكنه التأثير عليه بشكل غير مباشر عن طريق وضع السياسات (حولها لاحقًا).

الآن دعونا نلقي نظرة على ميزات تنفيذ طبقات التخزين في Unity. تميز الوحدة 3 مستويات ، أو تيرا:

  • أداء فائق (SSDs)
  • الأداء (SAS HDD 10k / 15k RPM)
  • السعة (NL-SAS HDD 7200 RPM)

يتم تقديمها بترتيب تنازلي للأداء والسعر. يتضمن الأداء الفائق محركات الأقراص ذات الحالة الصلبة (SSD) حصريًا. في قرصين آخرين - محركات الأقراص المغناطيسية ، تختلف في سرعة الدوران ، وبالتالي الأداء.

يتم دمج وسائط التخزين من مستوى واحد وحجم واحد في صفيف RAID ، لتشكيل مجموعة RAID (مجموعة RAID ، باختصار - RG) ؛ يمكن العثور على مستويات RAID المتاحة والموصى بها في الوثائق الرسمية. من مجموعات RAID من مستوى واحد أو عدة مستويات ، يتم تكوين تجمعات التخزين ، والتي يتم بعدها تخصيص مساحة حرة. وبالفعل من مساحة التجمع مخصصة لأنظمة الملفات و LUNs.



لماذا أحتاج Tiering؟


باختصار وملخص: لتحقيق نتائج أكبر باستخدام الحد الأدنى من الموارد. بشكل أكثر تحديدًا ، تُفهم النتيجة عادةً على أنها مجموعة من خصائص أنظمة التخزين - السرعة ووقت الوصول ، وتكلفة التخزين ، وغيرها. يعني الحد الأدنى من الموارد أقل تكلفة: المال والطاقة وما إلى ذلك. ينفذ FAST VP فقط آليات إعادة توزيع البيانات على مستويات مختلفة في أنظمة تخزين Unity / Unity XT. إذا كنت تصدقني ، يمكنك تخطي الفقرة التالية. بالنسبة للبقية ، سأخبرك بالمزيد.

يتيح لك التوزيع الصحيح للبيانات حسب مستويات التخزين توفير التكلفة الإجمالية للتخزين من خلال التضحية بسرعة الوصول إلى بعض المعلومات النادرة الاستخدام ، وزيادة الإنتاجية عن طريق نقل البيانات المستخدمة بشكل متكرر إلى وسائط تخزين أسرع. هنا قد يجادل شخص ما بأنه حتى من دون التلاعب ، يعرف المسؤول العادي مكان وضع البيانات ، وما الخصائص المرغوبة لنظام التخزين لمهمته ، وما إلى ذلك. هذا صحيح بلا شك ، ولكن التوزيع اليدوي للبيانات له عيوبه:

  • يستغرق وقت واهتمام المسؤول ؛
  • ليس من الممكن دائمًا "إعادة رسم" موارد التخزين للظروف المتغيرة ؛
  • تختفي ميزة مهمة: وصول موحد إلى الموارد الموجودة على مستويات تخزين مختلفة.

لجعل مسؤولي التخزين أقل قلقًا بشأن الأمن الوظيفي ، سأضيف أن تخطيط الموارد المناسب ضروري أيضًا. الآن بعد أن تم تحديد مهام طبقات لفترة وجيزة ، دعنا نرى ما يمكن أن تتوقعه من نائب الرئيس FAST. حان الوقت للعودة إلى التعريف. أول كلمتين - مؤتمتة بالكامل - تُترجم حرفياً إلى "مؤتمتة بالكامل" وتعني أن توزيع المستويات يحدث تلقائيًا. حسنًا ، Virtual Pool عبارة عن تجمع بيانات يتضمن موارد من مستويات تخزين مختلفة. إليك ما يبدو عليه:

صورة

بالنظر إلى المستقبل ، سأقول أن FAST VP ينقل البيانات فقط داخل تجمع واحد ، وليس بين تجمعات متعددة.

المهام يحل نائب الرئيس FAST


دعونا نتحدث بشكل تجريدي أولاً. لدينا تجمع وبعض الآليات التي يمكنها إعادة توزيع البيانات داخل هذا التجمع. تذكر أن مهمتنا هي تحقيق أقصى قدر من الأداء ، نسأل أنفسنا: بأي طرق يمكن تحقيقه؟ يمكن أن يكون هناك العديد منها ، وهنا يوجد لدى FAST VP ما تقدمه للمستخدم ، نظرًا لأن التكنولوجيا هي أكثر من مجرد طبقات تخزين. إليك بعض الطرق التي يمكن من خلالها لـ FAST VP زيادة أداء التجمع:

  • توزيع البيانات حسب أنواع الأقراص المختلفة ومستوياتها
  • توزيع البيانات بين محركات الأقراص من نفس النوع
  • توزيع بيانات توسيع البركة

قبل تحليل كيفية حل هذه المهام ، نحتاج إلى معرفة بعض الحقائق الضرورية حول عمل نائب الرئيس FAST. يعمل FAST VP مع كتل بحجم معين - 256 ميغابايت. هذا هو أصغر "جزء" مستمر من البيانات التي يمكن نقلها. يتم استدعاؤه في الوثائق: شريحة. من وجهة نظر FAST VP ، تتكون جميع مجموعات RAID من مجموعة من "القطع". وفقًا لذلك ، يتم تجميع كافة إحصائيات الإدخال / الإخراج لمجموعات البيانات هذه. لماذا يتم اختيار حجم الكتلة هذا وهل سيتم تخفيضه؟ الكتلة كبيرة بما فيه الكفاية ، ولكن هذا حل وسط بين دقة البيانات (حجم الكتلة الأصغر - التوزيع بشكل أكثر دقة) وموارد الحوسبة المتاحة: في ظل القيود الصارمة الحالية على ذاكرة الوصول العشوائي وعدد كبير من الكتل ، يمكن أن تستغرق هذه الإحصائيات الكثير ، وسوف يزيد عدد الحسابات بشكل متناسب.

كيف يضع نائب الرئيس FAST البيانات في التجمع. سياسة


للتحكم في وضع البيانات في التجمع مع تمكين FAST VP ، توجد السياسات التالية:

  • أعلى مستوى متاح
  • الطبقة التلقائية
  • بدء عالي ثم المستوى التلقائي (افتراضي)
  • أدنى مستوى متاح

تؤثر على كل من الموضع الأولي للكتلة (تم تسجيل البيانات لأول مرة) وإعادة التوزيع اللاحقة. عندما تكون البيانات موجودة بالفعل على الأقراص ، سيتم بدء إعادة التوزيع وفقًا للجدول الزمني أو يدويًا.

يحاول أعلى مستوى متاح وضع الكتلة الجديدة على المستوى الأكثر إنتاجية. مع نقص المساحة عليه - على مستوى الأداء التالي ، ولكن بعد ذلك يمكن نقل البيانات إلى مستوى أكثر إنتاجية (إذا كان هناك مساحة أو مزدحمة البيانات الأخرى). يضع Auto-Tier البيانات الجديدة على مستويات مختلفة اعتمادًا على حجم المساحة المتوفرة ، ويتم إعادة توزيعها بناءً على الطلب والمساحة الخالية. بدء عالية ثم Auto-Tier هي السياسة الافتراضية ويوصى بها أيضًا. في الموضع الأولي ، يعمل كأعلى مستوى متاح ، ثم يتم نقل البيانات اعتمادًا على إحصاءات الاستخدام الخاصة بهم. تسعى سياسة أدنى مستوى متاح إلى وضع البيانات على أقل مستوى إنتاجي.

يتم نقل البيانات بأولوية منخفضة حتى لا تتداخل مع العمل المفيد لنظام التخزين ، ولكن هناك إعداد "معدل نقل البيانات" الذي يغير الأولوية. هناك خصوصية: ليست كل كتل البيانات لديها نفس تسلسل إعادة التوزيع. على سبيل المثال ، سيتم نقل الكتل المميزة ببيانات وصفية إلى مستوى أسرع أولاً. البيانات الوصفية ، إذا جاز التعبير ، "بيانات حول البيانات" ، بعض المعلومات الإضافية التي ليست بيانات المستخدم ، ولكنها تخزن وصفها. على سبيل المثال ، معلومات في نظام الملفات حول الكتلة التي يوجد فيها ملف معين. وهذا يعني أن سرعة الوصول إلى البيانات تعتمد على سرعة الوصول إلى البيانات الوصفية. بالنظر إلى أن البيانات الوصفية عادة ما تكون أصغر حجمًا ، فمن المتوقع أن يستفيد المزيد من الانتقال إلى أقراص أكثر إنتاجية.

المعايير التي يستخدمها نائب الرئيس السريع في العمل


المعيار الرئيسي لكل كتلة ، إذا كان فظاظة للغاية ، هو سمة "الطلب" على البيانات ، والذي يعتمد على عدد القراءات والكتابة لجزء البيانات. تسمى هذه الخاصية "درجة الحرارة". هناك بيانات ساخنة أكثر سخونة من التي لم تتم المطالبة بها. يتم حسابها بشكل دوري ، بشكل افتراضي بفاصل ساعة واحدة.

تتميز وظيفة حساب درجة الحرارة بالخصائص التالية:

  • في غياب I / O ، "تبرد" البيانات بمرور الوقت.
  • مع حمولة أكثر أو أقل من نفس الوقت ، ترتفع درجة الحرارة أولاً ثم تستقر في نطاق معين.

علاوة على ذلك ، يتم أخذ السياسات الموضحة أعلاه والمساحة الخالية في كل مستوى بعين الاعتبار. للتوضيح ، سأعطي صورة من الوثائق. هنا تشير الألوان الأحمر والأصفر والأزرق إلى كتل ذات درجة حرارة عالية ومتوسطة ومنخفضة ، على التوالي.

صورة

لكن عد إلى المهام. لذا ، يمكننا البدء في تحليل ما يتم القيام به لحل مشاكل نائب الرئيس السريع.

أ. توزيع البيانات حسب أنواع الأقراص المختلفة ومستوياتها


في الواقع ، هذه هي المهمة الرئيسية لنائب الرئيس السريع. والباقي ، بمعنى ما ، مشتق منه. بناءً على السياسة المحددة ، سيتم توزيع البيانات عبر مستويات تخزين مختلفة. بادئ ذي بدء ، تؤخذ سياسة الموضع في الاعتبار ، ثم درجة حرارة الكتلة وحجم / سرعة مجموعات RAID.

بالنسبة لسياسات المستوى الأعلى / الأدنى المتاح ، كل شيء بسيط للغاية. بالنسبة للآخرين ، هذه هي الحالة. على مستويات مختلفة ، يتم توزيع البيانات مع مراعاة حجم وأداء مجموعات RAID: بحيث تكون نسبة "درجة الحرارة" الإجمالية للكتل إلى "الأداء الأقصى الشرطي" لكل مجموعة RAID هي نفسها تقريبًا. وبالتالي ، يتم توزيع الحمل أكثر أو أقل بالتساوي. يتم نقل البيانات الأكثر طلبًا إلى شركات النقل السريع ، ونادراً ما يتم استخدامها - إلى الشركات الأبطأ. من الناحية المثالية ، يجب أن يكون التوزيع شيء من هذا القبيل:

صورة

توزيع البيانات بين الأقراص من نفس النوع


تذكر ، في البداية كتبت أن ناقلات المعلومات من مستوى واحد أو عدة مستويات يتم دمجها في تجمع واحد؟ في حالة مستوى واحد لـ FAST VP ، هناك أيضًا عمل. لزيادة الأداء إلى أقصى حد على أي مستوى ، من المستحسن توزيع البيانات بالتساوي بين الأقراص. سيسمح هذا (نظريًا) بالحصول على أقصى عدد من IOPS. يمكن اعتبار البيانات داخل مجموعة RAID موزعة بالتساوي عبر الأقراص ، ولكن بين مجموعات RAID ، فإن هذا ليس دائمًا هو الحال دائمًا. في حالة عدم التوازن ، سينقل FAST VP البيانات بين مجموعات RAID بما يتناسب مع حجمها و "الأداء الشرطي" (من حيث العدد). للتوضيح ، سأعرض مخطط إعادة التوازن بين ثلاث مجموعات RAID:

صورة

ب. توزيع البيانات أثناء توسيع التجمع


هذه المهمة هي حالة خاصة للمهمة السابقة ويتم تنفيذها عند إضافة مجموعة RAID إلى التجمع. بحيث لا تقف مجموعة RAID المضافة حديثًا في وضع الخمول ، سيتم نقل جزء من البيانات إليها ، مما يعني أنه سيتم إعادة توزيع الحمل على جميع مجموعات RAID.

تسوية ارتداء SSD


من خلال تسوية الاهتراء ، يمكن لـ FAST VP إطالة عمر SSD ، على الرغم من أن هذه الميزة لا تتعلق مباشرة بتخزين التخزين. نظرًا لوجود بيانات درجة الحرارة بالفعل ، فإن عدد عمليات الكتابة يؤخذ أيضًا في الاعتبار ، يمكننا نقل كتل البيانات ، سيكون من المنطقي أن يقوم FAST VP بحل هذه المشكلة.

إذا تجاوز عدد السجلات في مجموعة RAID بشكل كبير عدد السجلات في مجموعة أخرى ، فسيقوم FAST VP بإعادة توزيع البيانات وفقًا لعدد عمليات الكتابة. من ناحية ، يزيل هذا الحمل ويحفظ موارد بعض الأقراص ؛ من ناحية أخرى ، يضيف "العمل" للأقراص الأقل تحميلًا ، مما يزيد من الأداء العام.

وبالتالي ، يتولى FAST VP المهام التقليدية لـ Storage Tiering ويقوم بأكثر من ذلك بقليل. كل هذا يسمح لك بتخزين البيانات بشكل فعال في عائلة Unity لأنظمة التخزين.


  1. . best practices, . , , , . .
  2. FAST VP, . , . .
  3. . , Unity .
  4. , . , FAST VP . , . , 2.
  5. FAST VP, . RAID- , . «» . , «» , . , , , , . , FAST VP, .

إذا نظرت عن كثب إلى هذا المنتج ، فيمكنك تجربة Unity في الأعمال التجارية مجانًا عن طريق تنزيل Unity VSA virtual appliance.



في نهاية المقال ، أشارك بعض الروابط المفيدة:


استنتاج


أود أن أكتب عن الكثير ، لكني أفهم أنه لن تكون جميع التفاصيل مثيرة للاهتمام للقارئ. على سبيل المثال ، يمكنك معرفة المزيد من التفاصيل حول المعايير التي يقرر FAST VP بواسطتها نقل البيانات ، حول عمليات تحليل إحصائيات الإدخال / الإخراج. أيضًا ، لا يتأثر موضوع التفاعل مع التجمعات الديناميكية على الإطلاق ، وهذا يوجه إلى مقالة منفصلة. يمكنك حتى أن تحلم بتطوير هذه التكنولوجيا. آمل ألا يكون ذلك مملًا ، ولم أتحملك. اراك قريبا!

All Articles