एकता भंडारण में तेजी से वीपी: यह कैसे काम करता है

आज हम एकता / एकता XT भंडारण प्रणालियों - FAST VP में कार्यान्वित एक दिलचस्प तकनीक के बारे में बात करेंगे। यदि आपने पहली बार एकता के बारे में सुना है, तो लेख के अंत में लिंक आप सिस्टम की विशेषताओं से परिचित हो सकते हैं। डेल ईएमसी परियोजना टीम के हिस्से के रूप में, मैं एक साल से अधिक के लिए फास्ट वीपी पर काम कर रहा हूं। आज मैं इस तकनीक के बारे में अधिक बात करना चाहता हूं और इसके कार्यान्वयन के कुछ विवरणों को प्रकट करना चाहता हूं। बेशक, केवल उन लोगों को प्रकट करने की अनुमति है। यदि आप कुशल डेटा भंडारण के मुद्दों में रुचि रखते हैं या केवल प्रलेखन का पूरी तरह से पता नहीं लगाया है, तो यह लेख निश्चित रूप से उपयोगी और दिलचस्प होगा।



मुझे इस बारे में तुरंत कहना चाहिए कि सामग्री में क्या नहीं होगा। प्रतियोगियों और उनके साथ तुलना के लिए कोई खोज नहीं होगी। मैं भी खुले स्रोत से समान तकनीकों के बारे में बात करने की योजना नहीं बनाता, क्योंकि एक जिज्ञासु पाठक उनके बारे में पहले से ही जानता है। और, ज़ाहिर है, मैं कुछ भी विज्ञापित नहीं करने जा रहा हूं।

भंडारण Tiering। फास्ट वीपी के लक्ष्य और उद्देश्य


फास्ट वीपी का मतलब वर्चुअल पूल के लिए पूरी तरह से स्वचालित स्टोरेज टायरिंग है। क्या यह जटिल है? कुछ नहीं, अब हम इसका पता लगाएंगे। तेरिंग डेटा स्टोरेज को व्यवस्थित करने का एक तरीका है, जिसमें कई स्तर (टियर) होते हैं जहाँ यह डेटा संग्रहीत होता है। प्रत्येक की अपनी विशेषताएं हैं। सबसे महत्वपूर्ण: सूचना की एक इकाई के भंडारण का प्रदर्शन, मात्रा और मूल्य। बेशक, उनके बीच एक रिश्ता है।

Tiering की एक महत्वपूर्ण विशेषता यह है कि डेटा तक पहुंच समान रूप से प्रदान की जाती है, भले ही वे वर्तमान में कितने स्तर के भंडारण पर हों, और पूल का आकार इसमें शामिल संसाधनों के आकार के योग के बराबर है। यहाँ कैश से अंतर निहित है: कैश का आकार संसाधन की कुल राशि (इस मामले में पूल) में नहीं जोड़ा गया है, और कैश डेटा मुख्य माध्यम पर डेटा के कुछ टुकड़े को डुप्लिकेट करेगा (या कैश से डेटा अभी तक नहीं लिखा गया है तो डुप्लिकेट करेगा)। इसके अलावा, स्तरों द्वारा डेटा का वितरण उपयोगकर्ता से छिपा हुआ है। यही है, वह यह नहीं देखता है कि प्रत्येक स्तर पर किस तरह का डेटा स्थित है, हालांकि वह नीतियों (लगभग बाद में) को स्थापित करके अप्रत्यक्ष रूप से इसे प्रभावित कर सकता है।

अब आइए एकता में स्टोरेज टीयरिंग के कार्यान्वयन की विशेषताओं को देखें। एकता 3 स्तरों, या tier'a को अलग करती है:

  • चरम प्रदर्शन (SSDs)
  • प्रदर्शन (SAS HDD 10k / 15k RPM)
  • क्षमता (NL-SAS HDD 7200 RPM)

उन्हें प्रदर्शन और कीमत के घटते क्रम में प्रस्तुत किया जाता है। चरम प्रदर्शन में विशेष रूप से ठोस राज्य ड्राइव (एसएसडी) शामिल हैं। दो अन्य tier'a में - चुंबकीय डिस्क ड्राइव, घूर्णी गति में भिन्नता और, तदनुसार, प्रदर्शन।

एक स्तर और एक आकार से संग्रहण मीडिया को एक RAID सरणी में संयोजित किया जाता है, जो एक RAID समूह (RAID समूह, शॉर्ट - आरजी के लिए) बनाता है; उपलब्ध और अनुशंसित RAID स्तर आधिकारिक दस्तावेज में पाए जा सकते हैं। एक या कई स्तरों के RAID समूहों से, भंडारण पूल बनते हैं, जहां से फिर खाली स्थान आवंटित किया जाता है। और पहले से ही पूल सिस्टम फ़ाइल सिस्टम और LUN के लिए आवंटित किया गया है।



मुझे तेरिंग की आवश्यकता क्यों है?


संक्षेप में और सार: अधिक से अधिक परिणाम प्राप्त करने के लिए, न्यूनतम संसाधनों का उपयोग करके। अधिक विशेष रूप से, परिणाम को आमतौर पर भंडारण प्रणालियों की विशेषताओं के एक सेट के रूप में समझा जाता है - गति और पहुंच का समय, भंडारण की लागत, और अन्य। न्यूनतम संसाधनों का मतलब कम से कम लागत है: पैसा, ऊर्जा, और इसी तरह। फास्ट वीपी सिर्फ एकता / एकता एक्सटी स्टोरेज सिस्टम में विभिन्न स्तरों पर डेटा पुनर्वितरण तंत्र को लागू करता है। यदि आप मुझ पर विश्वास करते हैं, तो आप अगले पैराग्राफ को छोड़ सकते हैं। बाकी के लिए मैं आपको कुछ और बताऊंगा।

भंडारण स्तर द्वारा डेटा का सही वितरण आपको कुछ दुर्लभ जानकारी तक पहुंच की गति का त्याग करके भंडारण की कुल लागत पर बचत करने की अनुमति देता है, और उपयोग किए गए डेटा को तेजी से भंडारण मीडिया में स्थानांतरित करके उत्पादकता में वृद्धि करता है। यहां कोई यह तर्क दे सकता है कि बिना किसी छेड़छाड़ के भी, सामान्य व्यवस्थापक जानता है कि कहां डेटा रखा जाए, उसके कार्य के लिए संग्रहण प्रणाली की क्या वांछनीय विशेषताएं हैं, आदि। यह निस्संदेह सच है, लेकिन मैनुअल डेटा वितरण में इसकी कमियां हैं:

  • व्यवस्थापक के समय और ध्यान की आवश्यकता है;
  • बदलती परिस्थितियों के लिए भंडारण संसाधनों को "पुनर्व्यवस्थित" करना हमेशा संभव नहीं होता है;
  • एक महत्वपूर्ण लाभ गायब हो जाता है: विभिन्न भंडारण स्तरों पर स्थित संसाधनों तक एकीकृत पहुंच।

भंडारण व्यवस्थापकों को नौकरी की सुरक्षा के बारे में कम चिंतित होने के लिए, मैं जोड़ूंगा कि सक्षम संसाधन योजना भी आवश्यक है। अब जब tiering के कार्यों को संक्षिप्त रूप से रेखांकित किया गया है, तो आइए देखें कि आप FAST VP से क्या उम्मीद कर सकते हैं। यहां परिभाषा पर लौटने का समय है। पहले दो शब्द - पूरी तरह से स्वचालित - शाब्दिक रूप से "पूरी तरह से स्वचालित" के रूप में अनुवाद करते हैं और इसका मतलब है कि स्तरों का वितरण स्वचालित रूप से होता है। खैर, वर्चुअल पूल एक डेटा पूल है जिसमें विभिन्न भंडारण स्तरों के संसाधन शामिल हैं। यहाँ यह कैसा दिखता है:

छवि

आगे देखते हुए, मैं कहूंगा कि FAST VP केवल एक पूल के भीतर डेटा ले जाता है, और कई पूलों के बीच नहीं।

कार्य तेजी से वीपी हल करता है


पहले सारगर्भित बात करते हैं। हमारे पास एक पूल और कुछ तंत्र हैं जो इस पूल के अंदर डेटा को फिर से वितरित कर सकते हैं। यह याद रखना कि हमारा कार्य अधिकतम प्रदर्शन प्राप्त करना है, हम खुद से पूछते हैं: किन तरीकों से इसे हासिल किया जा सकता है? उनमें से कई हो सकते हैं, और यहां FAST VP के पास उपयोगकर्ता की पेशकश करने के लिए कुछ है, क्योंकि प्रौद्योगिकी सिर्फ भंडारण tiering से कुछ अधिक है। यहाँ कुछ तरीके हैं FAST VP पूल प्रदर्शन को बढ़ा सकते हैं:

  • विभिन्न प्रकार के डिस्क, स्तरों द्वारा डेटा का वितरण
  • एक ही प्रकार के ड्राइव के बीच डेटा वितरित करना
  • पूल विस्तार डेटा वितरण

इन कार्यों को कैसे हल किया जाता है, इसका विश्लेषण करने से पहले, हमें FAST VP के काम के बारे में कुछ आवश्यक तथ्यों को जानना होगा। फास्ट वीपी एक निश्चित आकार के ब्लॉक के साथ संचालित होता है - 256 मेगाबाइट। यह डेटा का सबसे छोटा निरंतर "हिस्सा" है जिसे स्थानांतरित किया जा सकता है। इसे दस्तावेज में कहा गया है: टुकड़ा। फास्ट वीपी के दृष्टिकोण से, सभी RAID समूहों में ऐसे "टुकड़ों" का एक सेट होता है। तदनुसार, सभी I / O आँकड़े ऐसे डेटा ब्लॉक के लिए जमा होते हैं। यह ब्लॉक आकार क्यों चुना गया है और क्या इसे कम किया जाएगा? ब्लॉक काफी बड़ा है, लेकिन यह डेटा की ग्रैन्युलैरिटी (छोटे ब्लॉक आकार - अधिक सटीक रूप से वितरण) और उपलब्ध कंप्यूटिंग संसाधनों के बीच एक समझौता है: रैम पर मौजूदा सख्त प्रतिबंधों और बड़ी संख्या में ब्लॉक के तहत, ये आंकड़े बहुत अधिक ले सकते हैं, और गणना की संख्या आनुपातिक रूप से बढ़ेगी।

FAST VP एक पूल में डेटा कैसे डालता है। राजनेता


FAST VP सक्षम के साथ एक पूल में डेटा की नियुक्ति को नियंत्रित करने के लिए, निम्नलिखित नीतियां मौजूद हैं:

  • उच्चतम उपलब्ध टीयर
  • ऑटो टियर
  • हाई-स्टार्ट ऑटो-टियर (डिफ़ॉल्ट)
  • सबसे कम उपलब्ध टीयर

वे ब्लॉक के प्रारंभिक प्लेसमेंट (डेटा पहले रिकॉर्ड किए गए) और बाद में पुनर्वितरण दोनों को प्रभावित करते हैं। जब डेटा पहले से ही डिस्क पर स्थित है, तो पुनर्वितरण अनुसूची या मैन्युअल रूप से शुरू किया जाएगा।

उच्चतम उपलब्ध टीयर नए ब्लॉक को सबसे अधिक उत्पादक स्तर पर रखने की कोशिश कर रहा है। उस पर जगह की कमी के साथ - अगले प्रदर्शन स्तर पर, लेकिन फिर डेटा को और अधिक उत्पादक स्तर पर ले जाया जा सकता है (यदि अन्य डेटा बाहर जगह या भीड़ है)। ऑटो-टीयर उपलब्ध स्थान के आकार के आधार पर अलग-अलग स्तरों पर नए डेटा रखता है, और उन्हें मांग और मुक्त स्थान के आधार पर पुनर्वितरित किया जाता है। स्टार्ट हाई तो ऑटो-टियर डिफॉल्ट पॉलिसी है और सिफारिश भी। प्रारंभिक प्लेसमेंट में, यह सबसे अधिक उपलब्ध टियर के रूप में काम करता है, और फिर उनके उपयोग के आंकड़ों के आधार पर डेटा ले जाया जाता है। सबसे कम उपलब्ध टियर नीति कम से कम उत्पादक स्तर पर डेटा रखने की कोशिश करती है।

डेटा ट्रांसफर को कम प्राथमिकता के साथ किया जाता है ताकि स्टोरेज सिस्टम के उपयोगी कार्य में हस्तक्षेप न हो, हालांकि प्राथमिकता बदलने के लिए "डेटा स्थानांतरण दर" सेटिंग है। एक ख़ासियत है: सभी डेटा ब्लॉक में पुनर्वितरण का समान क्रम नहीं होता है। उदाहरण के लिए, मेटाडेटा के रूप में चिह्नित ब्लॉक पहले एक तेज़ स्तर पर ले जाया जाएगा। मेटाडेटा, इसलिए, "डेटा के बारे में डेटा", कुछ अतिरिक्त जानकारी है जो उपयोगकर्ता डेटा नहीं है, लेकिन इसका विवरण संग्रहीत करता है। उदाहरण के लिए, फ़ाइल सिस्टम की जानकारी जिसमें किसी विशेष फ़ाइल को ब्लॉक किया गया है। इसका अर्थ है कि डेटा तक पहुंच की गति मेटाडेटा तक पहुंच की गति पर निर्भर करती है। यह देखते हुए कि मेटाडेटा आमतौर पर आकार में बहुत छोटा होता है, अधिक उत्पादक डिस्क के लिए जाने से अधिक लाभ की उम्मीद है।

मापदंड जो फास्ट वीपी काम में उपयोग करता है


प्रत्येक ब्लॉक के लिए मुख्य मानदंड, यदि बहुत मोटा है, तो डेटा की "मांग" की विशेषता है, जो डेटा टुकड़ा के पढ़ने और लिखने की संख्या पर निर्भर करता है। इस विशेषता को "तापमान" कहा जाता है। लावारिस की तुलना में गर्म डेटा है। यह समय-समय पर एक घंटे के अंतराल के साथ डिफ़ॉल्ट रूप से गणना की जाती है।

तापमान गणना फ़ंक्शन में निम्नलिखित गुण होते हैं:

  • I / O की अनुपस्थिति में, समय के साथ डेटा "ठंडा" होता है।
  • एक लोड के साथ कम या ज्यादा समान समय में, तापमान पहले बढ़ जाता है और फिर एक निश्चित सीमा में स्थिर हो जाता है।

इसके अलावा, ऊपर वर्णित नीतियों और प्रत्येक स्तर पर मुक्त स्थान को ध्यान में रखा जाता है। स्पष्टता के लिए, मैं प्रलेखन से एक तस्वीर दूंगा। यहां लाल, पीले और नीले रंग क्रमशः उच्च, मध्यम और निम्न तापमान वाले ब्लॉक दर्शाते हैं।

छवि

लेकिन वापस कार्यों के लिए। इसलिए, हम विश्लेषण करना शुरू कर सकते हैं कि FAST VP की समस्याओं को हल करने के लिए क्या किया जा रहा है।

A. विभिन्न प्रकार के डिस्क, स्तरों द्वारा डेटा का वितरण


दरअसल, यह फास्ट वीपी का मुख्य कार्य है। बाकी, एक अर्थ में, इससे प्राप्त होते हैं। चयनित नीति के आधार पर, डेटा को विभिन्न स्टोरेज स्तरों पर वितरित किया जाएगा। सबसे पहले, प्लेसमेंट नीति को ध्यान में रखा जाता है, फिर RAID समूहों के ब्लॉक तापमान और आकार / गति।

उच्चतम / निम्नतम उपलब्ध टियर नीतियों के लिए, सब कुछ काफी सरल है। अन्य दो के लिए, यह मामला है। विभिन्न स्तरों पर, डेटा को RAID समूहों के आकार और प्रदर्शन को ध्यान में रखते हुए वितरित किया जाता है: ताकि प्रत्येक RAID समूह के "सशर्त अधिकतम प्रदर्शन" के लिए ब्लॉकों के कुल "तापमान" का अनुपात लगभग समान हो। इस प्रकार, लोड को कम या ज्यादा समान रूप से वितरित किया जाता है। अधिक मांग वाले डेटा को तेजी से वाहकों में स्थानांतरित किया जाता है, शायद ही कभी इस्तेमाल किया जाता है - धीमे लोगों के लिए। आदर्श रूप से, वितरण कुछ इस तरह होना चाहिए:

छवि

B. एक ही प्रकार के डिस्क के बीच डेटा का वितरण


याद रखें, शुरुआत में मैंने लिखा था कि एक या कई स्तरों से सूचना वाहक एक पूल में संयुक्त होते हैं? फास्ट वीपी के लिए एकल स्तर के मामले में भी काम है। किसी भी स्तर पर प्रदर्शन को अधिकतम करने के लिए, डिस्क के बीच समान रूप से डेटा वितरित करना उचित है। यह (सिद्धांत रूप में) IOPS की अधिकतम संख्या प्राप्त करने की अनुमति देगा। एक RAID समूह के अंदर डेटा को समान रूप से डिस्क में वितरित किया जा सकता है, लेकिन RAID समूहों के बीच यह हमेशा के मामले से दूर है। असंतुलन की स्थिति में, FAST VP अपने आकार और "सशर्त प्रदर्शन" (संख्यात्मक शब्दों में) के अनुपात में RAID समूहों के बीच डेटा ले जाएगा। स्पष्टता के लिए, मैं तीन RAID समूहों के बीच एक पुनर्वित्त योजना दिखाऊंगा:

छवि

B. पूल विस्तार के दौरान डेटा का वितरण


यह कार्य पिछले एक का एक विशेष मामला है और प्रदर्शन किया जाता है जब एक RAID समूह को पूल में जोड़ा जाता है। ताकि नए जोड़े गए RAID समूह निष्क्रिय न हों, डेटा का हिस्सा इसमें स्थानांतरित हो जाएगा, जिसका अर्थ है कि सभी RAID समूहों पर लोड को पुनर्वितरित किया जाएगा।

एसएसडी लेवलिंग पहनते हैं


पहनने के स्तर के साथ, फास्ट वीपी एक एसएसडी के जीवन का विस्तार कर सकता है, हालांकि यह सुविधा सीधे स्टोरेज टेरिंग से संबंधित नहीं है। चूंकि पहले से ही तापमान डेटा है, इसलिए लेखन कार्यों की संख्या को भी ध्यान में रखा जाता है, हम डेटा ब्लॉक को स्थानांतरित कर सकते हैं, इस समस्या को हल करने के लिए फास्ट वीपी के लिए यह तर्कसंगत होगा।

यदि एक RAID समूह में रिकॉर्ड की संख्या काफी दूसरे में रिकॉर्ड की संख्या से अधिक हो जाती है, तो FAST VP, लेखन कार्यों की संख्या के अनुसार डेटा का पुनर्वितरण करेगा। एक तरफ, यह लोड को हटाता है और कुछ डिस्क के संसाधन को बचाता है, दूसरी ओर, यह कम लोड वाले लोगों के लिए "काम" जोड़ता है, जिससे समग्र प्रदर्शन बढ़ जाता है।

इस प्रकार, फास्ट वीपी स्टोरेज टेरिंग के पारंपरिक कार्यों को लेता है और इससे थोड़ा अधिक करता है। यह सब आपको भंडारण प्रणालियों के एकता परिवार में डेटा को प्रभावी ढंग से संग्रहीत करने की अनुमति देता है।


  1. . best practices, . , , , . .
  2. FAST VP, . , . .
  3. . , Unity .
  4. , . , FAST VP . , . , 2.
  5. FAST VP, . RAID- , . «» . , «» , . , , , , . , FAST VP, .

यदि आप इस उत्पाद को करीब से देखते हैं, तो आप यूनिटी वीएसए आभासी उपकरण डाउनलोड करके व्यापार में यूनिटी को मुफ्त में आज़मा सकते हैं।



लेख के अंत में, मैं कुछ उपयोगी लिंक साझा करता हूं:


निष्कर्ष


मैं बहुत कुछ लिखना चाहूंगा, लेकिन मैं समझता हूं कि सभी विवरण पाठक के लिए दिलचस्प नहीं होंगे। उदाहरण के लिए, आप उन मानदंडों के बारे में अधिक विस्तार से बता सकते हैं जिनके द्वारा FAST VP डेटा ट्रांसफर करने का फैसला करता है, I / O आँकड़ों के विश्लेषण की प्रक्रियाओं के बारे में। इसके अलावा, डायनेमिक पूल के साथ बातचीत का विषय बिल्कुल भी प्रभावित नहीं होता है , और यह एक अलग लेख में आता है। तुम भी इस प्रौद्योगिकी के विकास पर सपना देख सकते हैं। मुझे आशा है कि यह उबाऊ नहीं था, और मैंने आपको बोर नहीं किया। जल्द ही फिर मिलेंगे!

All Articles