Otimize o armazenamento: um caso de unificação e menor custo de propriedade

O artigo descreve o processo de otimização da infraestrutura de armazenamento de uma empresa de classe média.

São consideradas justificativas para essa transição e uma breve descrição do processo de configuração de um novo sistema de armazenamento. Damos um exemplo dos prós e contras da mudança para o sistema selecionado.

Introdução


A infraestrutura de um de nossos clientes consistia em muitos sistemas de armazenamento heterogêneo de vários níveis: dos sistemas SOHO QNAP, Synology para dados do usuário aos sistemas de armazenamento Entry e Mid-range Eternus DX90 e DX600 para iSCSI e FC para sistemas de dados e virtualização de serviços.

Tudo isso diferiu tanto nas gerações quanto nos discos usados; parte dos sistemas era um equipamento legado que não tinha suporte de fornecedor.

Um problema separado era o gerenciamento de espaço livre, pois todo o espaço em disco disponível era altamente fragmentado em muitos sistemas. Como resultado, a inconveniência da administração e o alto custo de manutenção de uma frota de sistemas.

Enfrentamos o desafio de otimizar a infraestrutura de armazenamento para reduzir o custo de propriedade e unificação.

A tarefa foi analisada de forma abrangente pelos especialistas da empresa, levando em consideração os requisitos do cliente para disponibilidade de dados, IOPS, RPO / RTO, bem como a possibilidade de atualizar a infraestrutura existente.

Implementação


Os principais players do mercado para sistemas de armazenamento de gama média (e acima) são a IBM com Storwize; Fujitsu, representada pela linha Eternus, e NetApp com a série FAS. Como um sistema de armazenamento que atende aos requisitos fornecidos, esses sistemas foram considerados, a saber: IBM Storwize V7000U, Fujitsu Eternus DX100, NetApp FAS2620. Todos os três são Unified-SHD, ou seja, fornecem acesso de bloco e de arquivo e indicadores de desempenho próximos.

Porém, no caso do Storwize V7000U, o acesso a arquivos é organizado por meio de um controlador separado - um módulo de arquivo que se conecta ao controlador de bloco principal, que é um ponto adicional de falha. Além disso, esse sistema é relativamente difícil de gerenciar e não fornece isolamento adequado dos serviços.

O sistema de armazenamento Eternus DX100, também sendo um sistema de armazenamento unificado, tem sérias limitações no número de sistemas de arquivos criados, sem fornecer o isolamento necessário. Além disso, o processo de criação de um novo sistema de arquivos leva muito tempo (até meia hora). Os dois sistemas descritos não permitem o compartilhamento de servidores CIFS / NFS usados ​​no nível da rede.

Levando em consideração todos os parâmetros, incluindo o custo total de propriedade do sistema, foi escolhido o NetApp FAS2620, que consiste em um par de controladores que operam no modo Ativo-Ativo e permitem distribuir a carga entre os controladores. E quando combinado com os mecanismos internos de desduplicação e compactação on-line, ele pode economizar significativamente o espaço ocupado pelos dados em discos. Esses mecanismos se tornam muito mais eficazes ao agregar dados em um sistema em comparação com a situação inicial, quando dados potencialmente idênticos estavam localizados em diferentes sistemas de armazenamento e era impossível desduplicá-los entre si.

Esse sistema tornou possível colocar todos os tipos de serviços sob o controle de um único cluster de failover: SAN na forma de dispositivos de bloco para virtualização e NAS na forma de CIFS, compartilhamentos NFS para dados do usuário do Windows e sistemas * nix. Ao mesmo tempo, havia a possibilidade de uma separação lógica segura desses serviços, graças à tecnologia SVM (Storage Virtual Machine): os serviços responsáveis ​​por diferentes componentes não afetam os “vizinhos” e não permitem o acesso a eles.

Também é possível isolar serviços no nível do disco, evitando que o desempenho diminua sob carga pesada dos "vizinhos".

Para serviços que exigem leitura / gravação rápida, você pode usar um tipo híbrido de matriz RAID, adicionando vários SSDs ao agregado do HDD. O próprio sistema colocará dados "quentes" neles, reduzindo a latência da leitura de dados usados ​​com freqüência. Isso é um complemento ao cache da NVRAM, que garante sua atomicidade e integridade, além da alta velocidade de gravação (os dados serão armazenados na NVRAM alimentada pela bateria até que a confirmação de sua gravação completa seja recebida do sistema de arquivos) em caso de uma repentina falta de energia.

Após a migração dos dados para um novo sistema de armazenamento, torna-se possível usar com mais eficiência o espaço em disco do cache.

Lados positivos


Como mencionado acima, o uso deste sistema tornou possível resolver dois problemas ao mesmo tempo:

- Unificação

  • , , , .
  • . , LUN, .
  • . , . , Ethernet Fiber Channel .
  • , , . .



  • NetApp SVM (Storage Virtual Machine), , , . SVM, . /.
  • .
    SVM , , VLAN-. , SVM, VLAN’. , trunk-.
    iSCSI-, SAN- , , « » .
  • .
    - RAID- ( RAID- ), Volume. Volume SVM’, SVM’ . «» , «» SVM’ .
    RAID- , .



  • . RAID-, .
  • (CPU, RAM). storage-, , IO-, .
  • NetApp S3- , on-premise , .


- Tendo reduzido todos os serviços sob o controle de um sistema, esperamos obter um impacto maior ao desativar um componente (1 em 2 controladores versus 1 em 10 ou mais na infraestrutura antiga).
- Diminuição da distribuição da infraestrutura de armazenamento. Se sistemas de armazenamento anteriores pudessem ser localizados em diferentes andares / em diferentes edifícios, agora tudo está concentrado em um rack. Esse item pode ser compensado comprando um sistema menos eficiente e usando replicação síncrona / assíncrona em caso de situações de força maior.

Configuração passo a passo


Devido à confidencialidade das informações, é impossível demonstrar capturas de tela do ambiente real do cliente; portanto, as etapas de configuração são mostradas no ambiente de teste e repetem completamente as etapas executadas no ambiente produtivo do cliente.


O estado inicial do cluster. Dois agregados para partições raiz dos nós de cluster correspondentes clus01_01, clus01_02


Criando agregados para dados. Cada nó possui seu próprio agregado, consistindo em uma matriz RAID-DP.


Resultado: foram criados dois agregados: rg0_node02, rg1_node01. Ainda não há dados sobre eles.


Criação de SVM como um servidor CIFS. Para o SVM, é obrigatório criar um volume raiz para o qual o agregado raiz está selecionado - rg1_node01. Este volume armazenará configurações individuais do SVM.


CIFS- SVM. IP- ., . VLAN-, LACP . Volume , , .


, . 4,9 , . .


SVM iSCSI-. , Root Volume . CIFS- IP- iSCSI-, . , (LUN), .


LUN 10 . , .


Hyper-V Server iqn.


Hyper-V Server LUN Linux. Volume, , , . LUN , .

Source: https://habr.com/ru/post/undefined/


All Articles