Revisão e teste Huawei Dorado 5000V6


Seis meses atrás, eu já estava começando a falar sobre a atualização da linha de armazenamento da Huawei - Dorado V6. De fato, consegui conhecê-los antes do anúncio oficial, e é lógico que naquela época não tive a oportunidade de tocá-los com minhas próprias mãos. No meu artigo “ Huawei Dorado V6: Sichuan Heat ”, concentrei-me nos modelos Dorado 8000 e 18000 V6 mais antigos, pois, do ponto de vista da arquitetura, eles eram mais interessantes para mim naquele momento. Por fim, tive a oportunidade de testar o sistema 5000V6 em nosso laboratório e falar mais sobre o lado técnico desses sistemas.


Por um lado, esta é uma revisão e teste do sistema 5000V6; por outro, é uma continuação lógica do artigo anterior, porque Nos últimos seis meses, surgiram mais detalhes sobre os vários componentes do sistema, a lógica do trabalho e a funcionalidade implementada.

Mas vamos direto ao ponto. Como esse sistema é mais familiar - um sistema de controlador duplo, perdeu algumas das vantagens de suas irmãs mais velhas.

  1. Falta de Frontend e Backend compartilhados.

  2. Além disso, nos sistemas 5000V6 e 6000V6, apenas dois processadores Kunpeng 920 são instalados em cada um dos controladores e um no 3000V6.
  3. Se as mesmas prateleiras são fornecidas para 5000V6 e 6000V6 como para 8000V6 e 18000V6 com chips Kunpeng, projetadas para acelerar o processo de reconstrução, e essas prateleiras são conectadas via RDMA de 100Gb, somente para o modelo mais novo 3000V6, apenas as prateleiras SAS estão disponíveis.

  4. Os 5000V6 e 6000V6 foram projetados para instalar 36 SSDs PALM ou SSDs SAS comuns de 25 x 2,5 "" (selecionados ao configurar o sistema ao fazer o pedido), o 3000V6 mais novo suporta apenas 25 SSDs SAS.
  5. O 3000V6 suporta a instalação de até três placas de interface hot-swap no controlador, 5000V6 e 6000V6 suportam seis placas.

Como no artigo anterior, há uma nota de rodapé sobre o NVMe de ponta a ponta: o suporte ao NVMe sobre RoCE v2 e NVMe sobre TCP / IP está planejado em um futuro próximo.

Arquitetonicamente, os sistemas de controlador duplo, é claro, também diferem.


O OceanStor Dorado V6 usa uma arquitetura ativo-ativo que possui as seguintes tecnologias.

  • Algoritmo de balanceamento de carga: equilibra solicitações de leitura e gravação recebidas por cada controlador. 
  • Cache global: permite que os LUNs não tenham proprietários. Cada controlador processa as solicitações de leitura e gravação recebidas, fornecendo balanceamento de carga entre os controladores.
  • RAID 2.0+: distribui uniformemente os dados por todos os discos no pool de armazenamento, equilibrando a carga no disco.

RAID 2.0 ou superior


Se os dados não forem armazenados uniformemente em um SSD, alguns SSDs muito carregados podem se tornar um gargalo do sistema. O OceanStor Dorado V6 usa o RAID 2.0+ para distribuir uniformemente os dados entre todos os LUNs em cada SSD, equilibrando a carga entre as unidades. O OceanStor Dorado V6 implementa o RAID 2.0+ da seguinte maneira:

  • vários SSDs formam um pool de armazenamento
  • cada SSD é dividido em partes de tamanho fixo (normalmente 4 MB por parte) para simplificar o gerenciamento de espaço lógico
  • pedaços de SSDs diferentes formam um grupo de pedaços com base na política RAID definida pelo usuário
  • o grupo de partes é dividido em "grãos" (geralmente 8 KB), que são a menor unidade de volumes


Gravação de faixa completa na linha


Os chips de memória flash nos SSDs podem ser apagados um número limitado de vezes. No modo tradicional de reescrita de RAID (gravação no local), os dados quentes no SSD são continuamente substituídos e seus chips flash se desgastam rapidamente. O OceanStor Dorado V6 usa a gravação de redirecionamento total (ROW) para dados novos e antigos. Ele aloca um novo chip flash para cada registro, equilibrando o número de vezes que todos os chips flash são apagados. Isso reduz significativamente a carga do processador no próprio controlador e a carga de leitura / gravação no SSD durante o processo de gravação, aumentando o desempenho do sistema em diferentes níveis de RAID.


Priorização de ponta a ponta de E / S


Para garantir uma latência consistente para certos tipos de E / S, os controladores OceanStor Dorado V6 marcam cada operação de E / S com prioridade, de acordo com seu tipo. Isso permite que o sistema planeje a CPU e outros recursos e os priorize, oferecendo uma garantia de latência com base nas prioridades de E / S. Em particular, depois de receber vários SSDs de E / S, verifique suas prioridades e processe principalmente operações com uma prioridade mais alta.

O OceanStor Dorado V6 classifica as operações de E / S nos cinco tipos a seguir e as prioriza em ordem decrescente, fornecendo ótima resposta de E / S interna e externa:

  • operações de leitura / gravação
  • recursos avançados de E / S
  • rebild
  • cache de descarga
  • Coleta de lixo


Em cada unidade, além de priorizar as operações de entrada / saída, o OceanStor Dorado V6 também permite solicitações de leitura de alta prioridade para interromper as operações atuais de gravação e exclusão. Nesse caso, o atraso de leitura do disco (se não houver dados no cache) afeta diretamente o atraso de leitura do host. Normalmente, uma unidade flash SSD executa três operações: ler, gravar e apagar. O atraso de apagamento é de 5 ms a 15 ms, o atraso de gravação é de 2 ms a 4 ms e o atraso de leitura é de dezenas de microssegundos a 100 microssegundos. Quando o chip flash executa uma operação de gravação ou exclusão, a operação de leitura deve esperar até que a operação atual seja concluída, o que leva a um aumento significativo no atraso da leitura.

Gabinete de disco inteligente


Como escrevi em um artigo anterior, as novas prateleiras de disco estão equipadas com seu próprio processador e RAM. Isso permite transferir tarefas como recuperação de falhas de disco dos controladores. Isso reduz significativamente a carga nos controladores em caso de recuperação de dados devido a falhas no disco. A figura a seguir mostra o processo de recuperação de dados em uma única prateleira de disco usando RAID 6 (21 + 2) como exemplo. Se a unidade D1 estiver com defeito, o controlador deve ler D2-D21 e P e, em seguida, recontar D1. No total, 21 blocos de dados devem ser lidos nos discos. As operações de leitura e restauração consomem grandes recursos do processador.


O compartimento do Smart Disk Enclosure recebe uma solicitação de restauração e lê os dados para calcular localmente os dados de paridade. Então ela só precisa transferir os dados de paridade para o controlador. A figura a seguir mostra que apenas quatro blocos de dados de paridade precisam ser transferidos entre o controlador e a prateleira do disco. Isso economiza o desempenho das operações de recuperação, reduzindo a largura de banda da rede em cinco vezes.


Como resultado, transferindo essa carga para os processadores na prateleira, é possível reduzir a carga nos controladores da tarefa de reconstrução para menos de 10%.

SmartDedupe e SmartCompression


O OceanStor Dorado V6 realiza automaticamente desduplicação e compactação adaptáveis ​​com base nas características dos dados do usuário, maximizando a eficiência. O processo adaptativo de desduplicação e compactação é o seguinte.

  1. , , . , . .
  2. , «» (SFP) «». , .
  3. Quando vários SFPs idênticos são acumulados na tabela "recursos", os dados correspondentes a esses SFPs são lidos nos discos de deduplicação após o processamento. Após a eliminação da duplicação, a tabela de impressão digital é atualizada.

Antes de compactar os dados, o OceanStor Dorado V6 usa seu próprio algoritmo de pré-processamento para determinar a parte que é difícil de compactar nos blocos de dados com base no formato dos dados. 

O OceanStor reordena os dados, dividindo-os em duas partes:

  • para a parte que é difícil de compactar, o sistema o comprime usando um algoritmo de compressão Huawei especialmente desenvolvido
  • por outro lado, o sistema usa um algoritmo de compactação comum

Alguns fornecedores de armazenamento já estão usando compactação de dados em seu arsenal. Mas eles geralmente usam um bloco de 4K ou 1K para compactar os dados. A Huawei foi além e usa o alinhamento de bytes. Eu acho que a ilustração é clara.


Assim, ajustamos 32 KB de dados do usuário em menos de 5 KB.

A compactação e a desduplicação agora sempre funcionam a partir do momento em que você instala a licença apropriada do Storage Efficiency. Ele não pode ser desativado no Device Mabager, mas se você realmente quiser, isso pode ser feito através da CLI. De acordo com a lógica do fornecedor, as tecnologias de economia de espaço devem sempre funcionar em SSDs.

Um ponto importante em toda a linha. Embora existam apenas cinco modelos, eles diferem entre si no volume do cache de cada controlador:

  • OceanStor Dorado 3000 V6: 192 GB
  • OceanStor Dorado 5000 V6: 256 GB / 512 GB
  • OceanStor Dorado 6000 V6: 1024 GB
  • OceanStor Dorado 8000 V6: 512 GB / 1024 GB / 2048 GB
  • OceanStor Dorado 18000 V6: 512 GB / 1024 GB / 2048 GB

Como você pode ver, o volume total de modelos mais antigos não muda, mas o número de unidades muda. De acordo com declarações de engenheiros da Huawei, eles simplesmente não tiveram a oportunidade de testar sistemas em um volume maior que 2Pb. Teoricamente, eles apóiam mais.

Número máximo de unidades / capacidade máxima: 

  • OceanStor Dorado 3000 V6 - 1000 / 500TiB
  • OceanStor Dorado 5000 V6 - 1200 / 1024TiB
  • OceanStor Dorado 6000 V6 - 1500/2048TiB
  • OceanStor Dorado 8000 V6 - 3200 / 2048TiB
  • OceanStor Dorado 18000 V6 - 6400/2048TiB

Em um artigo anterior, esqueci de mencionar quais placas de interface estão geralmente disponíveis:


Eu já disse (no artigo anterior e neste) que a Huawei oferece SSDs de design próprio - Palm Size, ou, como eles chamam, SSDs desenvolvidos pela Huawei (HSSD) como dispositivos de armazenamento.

Além do fato de a empresa considerar seu desenvolvimento mais rápido, também oferece alguns recursos importantes.



  • SSD / - NAND. - NAND.

    HSSD . SSD , /. SSD / , , , , .
  • (Bad Block)

    - NAND. HSSD /, - NAND. , SSD (XOR) . HSSD , .
  • Verificação de antecedentes

    Após armazenar os dados no flash NAND por um longo período, podem ocorrer erros nos dados devido à interferência de leitura, interferência de gravação ou mau funcionamento acidental. O HSSD lê periodicamente dados de uma memória flash NAND, verifica alterações de bits e grava alterações de bits em novas páginas. Esse processo pré-detecta e processa riscos, o que evita efetivamente a perda de dados e melhora a segurança e a confiabilidade dos dados.

Então, vamos diretamente para os testes. Testamos as duas variações dos controladores 5000V6 com cache de 256 GB e 512 GB.

O primeiro teste foi, por assim dizer, aquecimento.


Como podemos ver, nesse perfil de carga de 8k 50r / 50rw, a diferença foi de cerca de 7% (220 kIOPs versus 205 kIOPs) e afetou apenas o número final de IOPS, e o tempo de resposta permaneceu no mesmo nível - 0,9 ms.

A propósito, era muito simples determinar que começamos a descansar no controlador, o próprio sistema relatou uma alta utilização dos processadores do controlador.


O segundo teste que usamos para todos os sistemas em SSDs é avaliar e compará-los com um perfil mais complexo.

Perfil
[global]
direct=1
thread=1
iodepth=16
filename=/dev/sdb
ioengine=libaio
runtime=3600000
group_reptorting
time_based
[8r]
rw=randread
numjobs=24
bs=8k

[8w]
rw=randwrite
numjobs=24
bs=8k

[32r]
rw=randread
bs=32k
numjobs=1

[32w]
rw=randwrite
numjobs=1
bs=32k

[128r]
rw=read
bs=128k
numjobs=1

[128w]
rw=write
bs=128k
numjobs=1

[512r]
rw=read
bs=512k
numjobs=1

[512w]
rw=write
bs=512k
numjobs=1


Aqui a imagem é completamente diferente. Se a diferença no número de IOPS em dois mil (172 kIOPs versus 170 kIOPs) não for significativa, o atraso aumentará cinco vezes (de 0,4 ms para 2,1 ms), informando que, ao trabalhar com um bloco grande, uma quantidade maior de cache dá uma vantagem ao sistema.

No ano passado, colegas e eu já testamos o Huawei Dorado 5000 V3 , então agora podemos comparar esses dois sistemas.


Progresso na face. O perfil de carga e o procedimento de teste foram os mesmos nos dois casos.

Obviamente, seria bom fazer uma comparação com os concorrentes, pessoalmente, minhas mãos estavam com muita vontade de comparar com o sistema NetApp AFF A400, Full NVMe, que apareceu há pouco tempo. Infelizmente, ela ainda não visitou nosso laboratório de testes e a comparação com o AFF A300 não é totalmente lógica, embora o Dorado 5000 V3 anterior da Huawei tenha sido posicionado como seu concorrente.

No pátio do século 21, muitas empresas oferecem vários programas para aumentar a atratividade de seus sistemas. A Huawei decidiu seguir nessa direção.

Garantia Eficaz de Capacidade


Com os novos sistemas de armazenamento V6, você pode confiar com segurança no armazenamento eficiente de dados com compactação e desduplicação. Em geral, muitos fornecedores no mercado já oferecem programas semelhantes, que devido ao armazenamento mais eficiente permitem o armazenamento garantido de mais dados no volume útil adquirido do sistema de armazenamento de dados.

O custo de cada terabyte de SSDs ainda é bastante alto, portanto as tecnologias de compactação e desduplicação são extremamente úteis e mostram alta eficiência em muitos tipos de dados. Se seus dados forem vídeo, áudio, imagens, dados científicos, PDF, XML ou dados criptografados, a desduplicação não será eficaz, caso contrário, a garantia funcionará. Mesmo que você tenha adquirido um sistema com o número máximo de unidades instaladas, as unidades do programa também receberão uma prateleira de expansão.

Flashver



Se, juntamente com o array, você adquirir o programa Huawei Hi-Care Onsite ou Co-Care ou superior, poderá contar com a atualização gratuita dos controladores para novos modelos da mesma linha. Isso permite que você tenha o sistema mais moderno e produtivo sem a necessidade de comprar novos sistemas ou migração de dados. O processo de substituição de controladores também ocorre sem interrupção do serviço.

Se você é um fã de interfaces e deseja consultar o Gerenciador de dispositivos atualizado, o DeviceManager do OceanStor Dorado 18000 V6 6.0.0 já está disponível no portal da Huawei .

Infelizmente, esse sistema só esteve em nossos testes por alguns dias, portanto, apenas conseguimos medir o desempenho. Mas eu também gostaria de realizar testes funcionais, nossos testes de falha favoritos e verificar algumas reclamações de desempenho que estavam na linha V3 anterior na execução de algumas operações - é importante entender que mudanças na nova linha (e, consequentemente, no software) ocorreram e que efeito eles trouxeram?

Quero observar que a maioria dos testes que conduzo para meus artigos são de equipe. Expresso minha gratidão aos meus colegas do Grupo de integração da empresa "Onlanta" com quem trabalho. 

A propósito, estamos procurando um arquiteto de sistema em nossa equipe .

All Articles