Cisco UCS através dos olhos de um provedor de nuvem

Olá Habr!

Ser um provedor de nuvem significa acumular constantemente novos conhecimentos e experiência. Ao longo dos anos, formamos um número bastante grande de práticas que tentamos aderir para garantir o melhor nível de serviço. Um deles é o uso das soluções Cisco Unified Computing System. Por trás do corte, quero lhe dizer por que, em nossa opinião, o UCS é uma das melhores soluções para provedores e discutir alguns recursos do trabalho e casos de uso do sistema.

Quase 8 anos se passaram desde que o Cisco UCS apareceu no mercado. Este é um período suficiente para que o público tenha uma imagem completa da tecnologia e, a partir dos manuais, resenhas e artigos de treinamento, um volume volumoso de livro pode ser compilado. No entanto, nos artigos de marketing sobre este tópico, você obtém dois volumes. Vamos tentar falar sobre o Cisco UCS da maneira mais objetiva possível: destacaremos os principais recursos da solução; com base neles discutiremos os benefícios para os provedores de serviços em nuvem e compartilharemos casos.

No começo era a palavra


O termo “convergência” veio a ser usado pelos engenheiros da HP há cerca de 10 anos. Na verdade, a HP foi a primeira a lançar os chamados módulos convergidos para instalação no chassi HP BladeSystem c7000. Eles tornaram possível, por exemplo, alocar uma certa largura de banda para um servidor blade específico. Este foi o primeiro passo para a convergência, mas essa solução não possuía todos os recursos necessários dos sistemas convergidos.

Apenas para garantir, vamos explicar: a infraestrutura convergente é um único complexo de equipamentos e software com um único ponto de entrada para gerenciar todos os equipamentos incluídos no complexo, além de uma orquestra.

Quanto ao Cisco UCS, esta solução já é totalmente consistente com a definição de convergência em termos de equipamento e parte do pacote de software.

Arquitetura da solução


Estudamos cuidadosamente o esquema acima e fornecemos uma breve descrição dos elementos do complexo "de cima para baixo".



Software Cisco UCS Manager Um

único ponto de entrada para gerenciar todos os componentes de hardware mostrados no diagrama e um orquestrador que permite gerenciar componentes manualmente ou por meio da API REST. Este é um tipo de "cérebro" do complexo. Ele é instalado dentro da Fabric Interconnect. Sem exceção, todas as configurações do equipamento são realizadas através da interface de gerenciamento (GUI ou CLI) ou da API do UCS Manager.

Interconexão em tecido

Um switch unificado de hardware baseado no Cisco Nexus. Ele fornece conectividade de rede de todos os componentes do complexo, bem como conectividade de servidores blade com redes externas. O complexo inclui duas interconexões de malha. Nas versões mais recentes - FI6332 e FI6454 - é possível conectar até 20 chassis 5108, e o número total de servidores blade nesse caso atinge:

  • b480 M5 - até 80 servidores;
  • b200 M5 - até 160 servidores.

Hoje, essa é quase a única solução que oferece oportunidades de integração em um único ponto de entrada e suporta conectividade de rede contínua, sem o uso de switches ToR adicionais ou outros módulos instalados no chassi, juntamente com servidores blade.

Chassi c5108

Comparado ao FI, esses são dispositivos bastante simples. Seu layout é padrão para sistemas blade: PSUs, ventiladores, além de um componente-chave do chassi - módulos FEX, que fornecem conectividade entre servidores blade e FI. No momento da redação deste artigo, os módulos 2304 de 4 portas 40GbE e os módulos 10GbE de 8 ou 4 portas 2204 são suportados. Sua característica distintiva é a capacidade de agrupar portas, o que permite aumentar a largura de banda geral.

VIC (placa de interface virtual)

Adaptador inteligente instalado no servidor blade. Permite alocar recursos de rede virtual para servidores de hardware e máquinas virtuais. Suporta protocolos de transferência de dados Eth e FC / FCoE.

Agora que o dispositivo da solução está mais ou menos claro, vamos falar sobre por que, na nossa visão subjetiva, o Cisco UCS é uma das soluções mais convenientes do mercado.

Por que o Cisco UCS


Agora que temos uma idéia clara do que consiste a solução, vamos falar sobre suas vantagens. Como a solução da Cisco é melhor que seus “parentes” - por exemplo, o mesmo HP Synergy? Essa pergunta é freqüentemente feita por nossos colegas, embora a resposta (como nos pareça) esteja na superfície. O ponto é este:

  • solução universal, conformidade com o termo "unificado" ⇒ declínio do OPEX;
  • a quantidade mínima de equipamento permite fechar o número máximo de casos (mais sobre eles abaixo), bem como a facilidade de redimensionar ⇒ CAPEX mais baixo;
  • Excelente desempenho e balanceamento de carga, disponibilidade em nível empresarial.

De fato, nesses três pontos, todos os principais requisitos da solução estão concentrados, tanto do lado comercial quanto do de TI. No entanto, sem casos, essas vantagens parecem um tanto infundadas, portanto, as decifraremos ainda mais, dando exemplos reais.

Aplicação prática


Conforme prometido no início deste artigo, nesta seção, examinaremos os estudos de caso do Cisco UCS. Começamos com uma revisão de nossa experiência e avançamos sem problemas para situações específicas.

Comissionamento de equipamentos


Durante o tempo em que usamos as soluções Cisco UCS, tivemos que comissionar e expandir 8 sistemas on-line (um complexo significa um par de Fabric Interconnect e pelo menos um chassi blade), no total - 16 FI e mais. O primeiro complexo que colocamos em operação em 2014, com uma experiência prática mínima. Esse processo levou três dias, dois dos quais foram gastos no estudo da documentação e no entendimento da lógica do equipamento. Observe que a documentação da Cisco está estruturada no nível dos melhores RedBooks da IBM - aqueles que estão familiarizados entenderão a comparação.

Tendo lidado com a lógica e os princípios básicos de configuração, montamos e lançamos facilmente o equipamento. Em seguida, atualizamos o firmware de todos os componentes, configuramos modelos de perfil de servidor e criamos perfis. Em apenas um dia útil.

A implementação adicional foi realizada como parte dos procedimentos padrão de gerenciamento de alterações da ITIL e levou não mais de quatro horas para implantar cada par de FIs e um ou dois chassis desde o momento da inicialização até que o chassi estivesse totalmente pronto para uso, incluindo a criação e configuração de todos os modelos e políticas necessários.

O uso da API REST e dos módulos PowerTools pode acelerar o processo de instalação. Por exemplo, a cópia de mais de 500 VLAN para uma nova instalação é feita em apenas duas etapas simples usando o PowerTools:

  • Buscando a lista de VLAN da infraestrutura de produção
  • fazendo upload da lista de VLANs para o novo complexo.

O dimensionamento da infraestrutura é realizado conectando o novo chassi aos servidores blade ao par FI instalado (se houver o número necessário de portas livres). O procedimento é 100% online e pode ser executado na interface do Cisco UCS Manager. Com as configurações globais corretas, imediatamente após as portas FI às quais o chassi está conectado serem comutadas para o modo operacional desejado, essas portas são coletadas automaticamente no canal da porta. Em seguida, é iniciado um procedimento de reconhecimento automatizado, dentro da estrutura da qual:

  • atualizar todos os componentes do chassi para a versão atual do FW;
  • Configuração do Power Cap;
  • mapeando as portas do Backplane no FEX para as fábricas e conjuntos de canais de portas necessários para essas mesmas portas.

Mais uma vez, lembramos que tudo isso é feito sem a intervenção dos engenheiros, com base nas políticas globais definidas durante o comissionamento do complexo.

Com o tempo, esse procedimento leva cerca de uma hora e meia. A conexão física do novo chassi com o FI consiste em alternar o FEX para as portas no FI, usando de maneira otimizada os cabos DAC. E não é necessário pegar cabos originais da Cisco.

Exploração


Quanto desse som ... Você pode falar muito sobre isso, e não apenas o bom. Como se costuma dizer, sem um barril de alcatrão, uma colher de mel não será tão saborosa. Mas, falando sério, todos os procedimentos de rotina que levam muitos minutos ou horas em uma infraestrutura típica são executados automaticamente a partir da GUI. Por exemplo, para espalhar uma nova VLAN em todos os servidores blade do complexo (e lembro-me de que suporta de 80 a 160 peças), basta adicioná-lo ao modelo vNIC na seção Política de LAN - a nova VLAN se espalhará automaticamente em todos os servidores blade, nos perfis dos quais este modelo vNIC está presente.

Como estamos falando de política, vale a pena dizer que literalmente todas as configurações são definidas por meio de políticas. Você pode, é claro, não usá-los, mas será ... ahem, muito difícil. Todas as configurações de rede para servidores blade, incluindo endereços MAC e IP para KVM, Flow Control, LACP, CDP, VMQ, são definidas por meio de políticas. As configurações do BIOS, a versão do FW que será carregada no servidor blade, o Power Control, as configurações de acesso IPMI e muito mais são determinadas da mesma maneira.
Aqui está outro exemplo que introduz a capacidade do UCS de automatizar operações de rotina, como configurações de zoneamento de FC.

Nas configurações da Diretiva de Conexão de Armazenamento, basta selecionar o tipo de zoneamento desejado e defini-lo, por exemplo, como "único destino inicializador único". Nesse caso, ao vincular o servidor blade ao modelo de perfil, uma zona separada será criada. Essa zona incluirá automaticamente o destino WWN especificado e o WWPN do HBA virtual da porta desejada pertencente à fábrica desejada.

As políticas estão vinculadas aos perfis de modelo para servidores. Então, tudo é simples: vinculando o modelo ao servidor blade e inicialização desejados. A saída é um servidor pronto para instalação do sistema operacional. A inicialização do servidor não leva mais que 10 a 20 minutos e pode ser executada simultaneamente para o número desejado de servidores. No total, em apenas 25 a 35 minutos, obtemos de 80 a 160 servidores completamente prontos para a instalação do sistema operacional. Obviamente, o processo de instalação também pode ser automatizado e a API do Cisco UCS pode ajudá-lo nessa tarefa, mas este é um tópico para outro artigo.

Total:Para implantar um complexo de servidores FI, chassi de 20 lâminas e servidores blade 160 b200 M5 do zero até a instalação do sistema operacional, um engenheiro não passará mais de 8 horas e, na maioria das vezes, cerca de 3 horas, será gasto na criação de políticas e modelos de perfil . O tempo restante pode ser dedicado a assuntos muito mais importantes, aguardando a inicialização do chassi e dos servidores blade depois de vincular os modelos ao último. O tempo de implantação indicado se encaixa perfeitamente no paradigma de redução de custos OPEX mencionado acima.

Sistema unificado


Versatilidade, versatilidade e mais uma vez universalidade - provavelmente é assim que você pode expressar o lema do complexo. Ilustramos esta tese com uma lista de recursos do Cisco UCS que a tornam única no mercado, mesmo após 8 anos. Pelos padrões de hoje, esse é um tempo muito longo.

  • unified 10GbE/16Gbit FC, 40 GbE ( 4x10 GbE breakout);
  • Fibre Channel, Ethernet FCoE FI;
  • FC Fabric FI, FC Brocade NPV;
  • FI rack- Cisco extender', UCS Manager;
  • FI rack- , L2 ;
  • FI Eth FC.

Obviamente, os recursos de gerenciamento de equipamentos de terceiros não estão incluídos no UCS Manager - a Cisco possui outras ferramentas para isso - mas os listados acima já são impressionantes. Aqui estão alguns exemplos em que os recursos unificados nos serviram bem:

Substituição temporária de comutadores Cisco Nexus A

entrega de novos comutadores Cisco Nexus foi atrasada significativamente. O novo armazenamento da NetApp chegou antes deles e poderia estar inativo por vários meses: não havia portas 10GbE suficientes para uma conexão completa à prova de falhas. Solução: conectamos o armazenamento via portas FI configuradas no modo Appliance, configuramos o canal da porta com suporte ao LACP, colocamos o armazenamento em operação alguns meses antes da chegada dos switches. O equipamento está em operação, gerando receita, o CAPEX está em declínio.

Migração para um novo sistema de armazenamento

Nosso cliente precisava migrar dados do antigo sistema de armazenamento EMC para o armazenamento NetApp com perdas mínimas. Não há portas livres em sua antiga fábrica de FC; não há como conectar o FI a uma fábrica comum. Mas havia portas gratuitas no armazenamento do cliente. Nós os conectamos ao FI, nós os levantamos no FC vSAN. Iniciamos a migração de máquinas virtuais por meio do Storage vMotion para NetApp conectado via NFS. Tudo está em ordem, todo mundo está feliz. Migração concluída com sucesso.

Cisco UCS e virtualização


Não se pode deixar de mencionar várias vantagens oferecidas pela arquitetura UCS, por exemplo, para uma infraestrutura virtual executando o VMware. Os adaptadores VIC, sobre os quais já falamos ao descrever componentes, são alternados fisicamente pelo chassi do Midplane com módulos de E / S pelas portas do Backplane. De 2 a 4 portas podem chegar a uma VIC, configurada automaticamente nas portas EtherChannel no nível do UCS Manager. Isso permite que você obtenha os seguintes benefícios das conexões de rede:

  • no nível da física, obtemos uma conexão à prova de falhas entre o servidor blade e o módulo de E / S no nível FI. Pelo menos uma porta de backplane é fornecida da malha A e uma da malha B.
  • FI . EtherChannel Backplane NIC Teaming , , FI. active-active .
  • 256 PCIe virtual devices (vNIC vHBA) VIC. VIC « » Service Profile Template, . vNIC vHBA .
  • Suporte VM-FEX, com o qual você pode organizar a comutação de passagem entre VM e FI usando a tecnologia VMWare Direct Path IO.

Como você pode ver, o complexo Cisco UCS realmente se provou em várias tarefas e casos. Por um lado, é uma solução bem documentada e testada pelo tempo. Por outro lado, não perde sua relevância e, idealmente, fecha de sua parte todas as tarefas de um provedor de nuvem. Se você tiver adições ao artigo ou quiser compartilhar sua própria experiência, estamos esperando por você nos comentários.

All Articles