Tornando o suporte mais barato, tentando não perder qualidade

O modo de emergência (também conhecido como IPKVM), que permite conectar-se ao VPS sem RDP diretamente do nível do hipervisor, economiza de 15 a 20 minutos por semana.

A primeira e mais importante coisa é não enfurecer as pessoas. Em todo o mundo, o suporte é dividido em linhas, e o funcionário deve ser o primeiro a tentar soluções típicas. Se a tarefa for eliminada dos limites - passe a segunda linha. Portanto, entre os administradores do VDS, muitas vezes há pessoas que sabem pensar. Ao contrário de muitos outros suportes. Bem, pelo menos significativamente mais frequentemente. E eles estruturam bem o ticket, descrevendo imediatamente tudo o que é necessário. Se na primeira linha “o olho está embaçado” e eles acidentalmente pedirem para ligá-lo e desligá-lo em resposta a isso, é um fiasco.

A tarefa é muito simples: tornar o suporte de nossa hospedagem VDS adequado com um mínimo de custos. Porque somos o fast food do mundo dos provedores de hospedagem: sem “lamber” especial, preços baixos, qualidade normal. Anteriormente, havia uma história sobre o fato de que, com o advento do Instagram, nyashki tentando automatizar a manutenção de uma conta e de pequenos empresários com contabilidade remota e o resto das pessoas que não estão muito entusiasmadas com a tecnologia, a comunicação "como um administrador com um administrador" parou de rolar. Eu tive que mudar o idioma da comunicação.

Agora vou falar um pouco mais sobre os processos - e sobre os batentes inevitáveis ​​com eles.

Não enfurecer as pessoas número 1


Qualquer suporte é a produção de transportadores. Quando um aplicativo chega, o funcionário de primeira linha imediatamente tenta reconhecer uma situação típica que aconteceu mil vezes e acontecerá mil vezes. A chance é 90% de que o aplicativo seja típico e você pode respondê-lo pressionando apenas alguns botões para substituir o modelo. Você geralmente precisa inserir algumas palavras no modelo - e pronto. Ou acesse a interface de controle e clique em alguns botões lá. Em casos mais complexos (transferências de zona para zona, por exemplo), você precisa executar ações de acordo com o algoritmo.

O que mais enfurece as pessoas, independentemente de outras qualidades de suporte, é uma reação típica a uma aplicação atípica. Chega um tíquete onde tudo é descrito em detalhes, há muitos dados necessários para três perguntas à frente, o cliente antecipa um diálogo ... E de acordo com as primeiras palavras, o oficial de suporte no piloto automático pega um acorde para substituir o modelo "tente reiniciar, deve ajudar".

É isso que abre o cérebro diretamente para as pessoas, e é após essas situações que as críticas mais negativas e os comentários furiosos permanecem. É claro que estávamos tão errados e a partir daí conhecemos as estatísticas. Em geral, erramos de maneiras diferentes, mas esses casos são sempre simplesmente selvagens. Inclusive para nós mesmos. Naturalmente, gostaríamos que isso não acontecesse. Mas isso não é muito possível na prática: a cada poucas semanas, um funcionário cansado da monotonia não, não e até pressiona botões engraçados.

Não enfurecer as pessoas número 2


A segunda coisa que abre o cérebro com igual sucesso é quando ninguém responde o ticket por tempo suficiente. Na Europa, esse tipo de comportamento de suporte é normal: três dias antes de um incidente ser levado ao trabalho é mais do que o normal. Mesmo se você for muito urgente e algo estiver queimando - sem redes sociais, sem telefone, sem mensageiro, apenas envie e-mail e aguarde sua vez. Na Rússia, isso é muito menos comum, mas alguns ingressos ainda são "esquecidos". No início, o SLA foi colocado na primeira reação por 15 minutos. E isso é com 24/7 honesto. É claro que, quando a hospedagem VDS se torna grande, ela aparece. Mas prestadores de serviços duvidosos não. E nós no começo éramos duvidosos e só então nos tornamos mais ou menos grandes. Ok, mais ou menos na média.

A primeira linha são os operadores que receberam scripts e foram ensinados a responder a situações típicas. Eles resolvem os problemas rapidamente e rapidamente e tentam, em 15 minutos, responder com uma ação típica ou informar que o ticket está funcionando e transferi-lo para o segundo.

A segunda linha já está hospedando administradores, eles podem fazer quase tudo manualmente. Há também um gerente de suporte que pode fazer tudo e um pouco mais. A terceira linha já é desenvolvedora, eles recebem tickets como "conserte isso na interface" ou "tal e tal parâmetro é incorretamente levado em consideração".

Reduza o número de aplicativos


Por razões óbvias, se você deseja fornecer suporte barato, não precisa aumentar a primeira linha para que as pessoas possam lidar com scripts mais rapidamente, mas aumentar a automação. Então, em vez de pessoas com scripts, existem scripts reais. Portanto, uma das primeiras coisas que fizemos foi automatizar os processos de criação de uma máquina virtual, escalando por recursos (incluindo disco para cima e para baixo, mas não a frequência do processador) e outras coisas semelhantes. Quanto mais o usuário puder da interface, mais fácil será viver a primeira linha e menos ela poderá ser. Quando um usuário lida com algo que está em sua conta pessoal, você precisa fazer isso e dizer como isso pode ser feito independentemente.

Se você não precisar de suporte, será bom.

O segundo recurso que economiza muito tempo é um longo preenchimento da base de conhecimento. Se o usuário tiver um problema que não está incluído na lista de ações suportadas (na maioria das vezes, são perguntas como "como instalar o servidor Minecraft" ou "Onde configurar o VPS no Win Server"), um artigo é escrito na base de conhecimento. O mesmo artigo detalhado foi escrito para todas as consultas estranhas. Por exemplo, se um usuário solicitar suporte para remover o firewall interno do Windows Server, enviaremos uma leitura sobre o que acontecerá se ele estiver realmente desabilitado e como redefinir as permissões apenas para o software selecionado. Porque o problema geralmente é que algo não pode se conectar devido às configurações e não ao firewall em si. Mas explicar isso todas as vezes no diálogo é muito difícil. E de alguma forma, não quero desativar o firewall, porque em breve perderemos a máquina virtual ou o cliente.

Se algo sobre o software aplicativo na base de conhecimento for muito visitado, você poderá adicionar o pacote de distribuição ao mercado, para que o serviço "elevar o servidor com este já instalado" seja exibido. Na verdade, isso aconteceu com o Docker e o servidor Minecraft. Novamente, um botão "faça-me bem" na interface economiza até centenas de tickets por ano.

Modo de emergência


Após essas ações, o dano mais grave que requer trabalho manual permanece com o fato de o usuário, por algum motivo, ter perdido os meios de acesso remoto ao SO convidado no hypervisor. O caso mais comum é uma configuração de firewall incorreta brega, o segundo mais frequente são alguns erros que impedem que o Win inicie normalmente e forçam você a reiniciar no Modo de Segurança. E no modo de segurança, o RDP não está disponível por padrão.

Criamos um modo de emergência para este caso. De fato, geralmente para acessar a máquina VDS, é necessário ter algum tipo de cliente para trabalho remoto. Na maioria das vezes, estamos falando de acesso ao console, RDP, VNC ou algo assim. A desvantagem desses métodos é que eles não funcionam sem o sistema operacional. Mas no nível do hipervisor, podemos colocar a imagem na tela e transmitir as teclas pressionadas lá! É verdade que isso não é doentio, ele carrega o processador (devido à transmissão real do vídeo), mas permite que você obtenha o resultado desejado.

Portanto, demos acesso ao modo de emergência a todos os usuários, mas é limitado pela duração do uso contínuo. Felizmente, como mostra a prática, esse tempo é suficiente para reiniciar e corrigir alguma coisa.

O resultado é ainda menos tíquetes de suporte. E onde o administrador pode consertar o ticket, o suporte não precisa ter as mãos e entender.

Problemas remanescentes


Muitas vezes, os usuários pensam que o suporte tem algo a eles. Infelizmente, nada pode ser feito com isso (bem, ou não criamos isso). Os dois exemplos mais comuns são limites de recursos e proteção contra DDoS.

Cada máquina virtual tem limites de carga no disco, memória e tráfego permitido. A possibilidade de definir limites é especificada na oferta, os próprios limites são selecionados para que a maioria dos usuários trabalhe em silêncio, sem nem mesmo saber sobre eles. Mas se de repente você começar a mexer muito com o canal e o disco, os algoritmos alertarão automaticamente o usuário. Desde abril do ano passado, removemos o bloqueio automático. Em vez disso - definindo limites flexíveis para um período variável.

Costumava ser assim: um aviso, se o usuário não atender, ele será bloqueado automaticamente. E, naquele momento, as pessoas ficaram ofendidas: "Por que você está, este é o seu sistema está com bugs, não havia nada!" - e então você pode tentar entender o software do aplicativo ou oferecer um aumento no plano tarifário. Não temos como entender o trabalho do software aplicativo, porque isso está além do suporte. Embora os primeiros casos tenham sido desmontados com os usuários. Lembro-me especialmente daquele em que o trapaceiro no YouTube tinha um cavalo de Troia embutido e esse cavalo de Troia tinha um fluxo de memória. Como resultado, eles chegaram à conclusão de que não são Heisenbags, mas problemas com os usuários; caso contrário, ficaríamos sobrecarregados com aplicativos semelhantes. Mas nenhuma pessoa admitiu ainda que poderia exceder as tarifas.

Uma história semelhante é com o DDoS: escrevemos que você, querido usuário, está sendo atacado. Conecte a proteção, por favor. E o usuário: "Sim, é você quem me ataca!" Obviamente, colocamos apenas um usuário com DDoS para gerar 300 rublos. Um negócio lucrativo. Sim, eu sei que muitas grandes empresas de hospedagem da categoria de mais caras incluem essa proteção na tarifa, mas não podemos fazer isso: a economia de fast food determina outros preços mínimos.

Não menos frequentemente, aqueles cujos dados foram excluídos estão insatisfeitos com o suporte.No sentido de que é legitimamente excluído após o término do prazo pago. Se alguém não estender o aluguel do VDS, algumas notificações virão com uma explicação do que acontecerá a seguir. No final do pagamento, a máquina virtual para, mas sua imagem é salva. Outro aviso chega e mais alguns. A imagem é armazenada por sete dias adicionais e somente então excluída para sempre. Portanto, há uma categoria de pessoas que estão muito descontentes com isso. A partir de "o administrador saiu, as notificações foram enviadas para seu e-mail, restaurado" e terminando com acusações de fraude e ameaças de violência física. O motivo é o mesmo preço para todos os outros usuários. Se mantivermos o mês, precisaremos de mais armazenamento. Isso significa ótimos preços para cada cliente. E a economia de fast food ... Bem, você entende.E, como resultado, recebemos comentários sobre os fóruns com o espírito de "gastou dinheiro, excluiu dados, golpistas".

Noto que temos uma linha de tarifas premium. É claro que a situação é diferente, porque levamos em conta os desejos do cliente e ajustamos de maneira flexível o limite e a exclusão, se não for pago (levamos para menos, apenas para não bloqueá-lo). Lá já é economicamente viável, porque realmente tudo acontece, e manter um grande cliente regular é caro.

Às vezes, os usuários são maliciosos. Várias vezes em nosso sistema, houve falhas no bloqueio de centenas de máquinas virtuais devido a algumas ações claramente ilegítimas dos clientes. Na verdade, precisamente devido a essas situações, precisávamos de nossos próprios drivers de rede para monitorar a atividade da rede e ver se o usuário não está executando um ataque do servidor. O monitoramento desse plano é importante para que as fronteiras das máquinas virtuais vizinhas não sejam violadas por indivíduos violentos.

Existem aqueles que banem spam, minam ou violam a oferta. Então ele bate em apoio e pergunta o que deu errado e por que o carro está trancado. Se o processo no ticket na captura de tela for chamado "spam remover.exe", provavelmente algo está errado. Em outro lugar a cada duas semanas, recebemos reclamações da Sony ou da Lucasfilm (agora Disney) de que alguém da nossa máquina virtual, do nosso intervalo de endereços IP, distribui um filme falso. Para tal bloqueio de uma vez e devolução do dinheiro restante na conta da oferta (lembre-se: a quantização é por segundo, ou seja, o saldo será sempre exato). E para devolver o dinheiro, de acordo com a lei, você precisa mostrar um passaporte: isso é contra a lavagem de dinheiro. Por alguma razão, em vez de mostrar o passaporte, os piratas escrevem que lhes tiramos o dinheiro, esquecendo de esclarecer parte das circunstâncias.

Ai sim. Temos a melhor solicitação do ano: "Posso testar uma máquina virtual por alguns dias a uma taxa de 30 rublos por mês antes da compra?"

Total


A primeira linha classifica tickets e responde com ações típicas. A maior parte do descontentamento está aqui. De qualquer forma, não funcionará para corrigi-lo, porque a base da correção está na automação de hospedagem, ou seja, em um enorme atraso. Sim, temos mais do que muitos no mercado, mas ainda não o suficiente. Portanto, o melhor que pode ser feito é estabelecer o monitoramento da primeira linha. Monitoramento da central de suporte - implementação de KPI de primeira linha. Em tempo real, os atrasos no SLA são visíveis: quem erra, geralmente o porquê. Os pedidos devido a esses alertas nunca são perdidos. Sim, eles podem responder a um ticket com um modelo fora do tópico, mas já o saberemos por feedback.

Se o cliente solicitar, o especialista da segunda linha poderá ir ao servidor e fazer o que o cliente precisa (a condição é a confirmação por uma carta na qual ele fornecerá os dados para entrar no servidor).

Fazemos isso muito raramente e confiamos nesse trabalho apenas da melhor maneira, porque queremos ter garantias de que os dados do usuário não serão danificados. O melhor é a segunda linha de suporte.

A primeira linha tem uma base de conhecimento onde você pode enviar para parecer complicado.

Uma conta pessoal rica, além de uma base de conhecimento - e agora conseguimos reduzir o número de chamadas para 1 a 1,5 por ano por cliente, em média.

A segunda linha geralmente processa aplicativos complexos que exigem trabalho manual. O que é característico: quanto mais caro o plano tarifário, menos aplicativos por máquina virtual. Geralmente, porque aqueles que podem pagar uma tarifa cara têm especialistas no estado ou apenas metade dos problemas não surge devido ao fato de haver uma configuração suficiente para tudo. Ainda me lembro do herói que não instalou o Windows Server mais antigo em uma configuração com 256 MB de RAM.

A segunda linha possui um conjunto de distribuições e um conjunto de scripts de automação. Ambos podem ser atualizados conforme necessário.

A segunda linha e os gerentes de tarifas VIP pessoais podem adicionar notas ao perfil do cliente. Se ele é um administrador de Linux, vamos anotá-lo. Essa será a primeira dica de linha: o usuário sabe com certeza que isso não será um tiro na perna, mas uma destruição controlada.

A terceira linha governa a mais estranha. Por exemplo, tivemos um bug no qual era impossível acessar uma das funções da sua conta pessoal no Firefox. O usuário chantageou diretamente: "Se você não o corrigir dentro de 12 horas, escreverei em todos os comentários sobre o host". Como se viu, o problema estava no bloco de anúncios personalizado. No lado do usuário, curiosamente. Erros complexos geralmente vêm sem detalhes e não podem mais ser repetidos. Existem detetives com uma captura de tela: "Por que você está consertando o mês dele?" - "Sim, procuramos seu bug o tempo todo", "Bem, encontrei novamente hoje, mas não consegui repeti-lo novamente" ...

Em geral, você nunca sabe onde será exibida uma captura de tela do diálogo com o suporte e se uma pessoa bate no suporte , então ele tem um problema. Você pode melhorar a atitude. Pelo menos tente.

Sim, sabemos que nosso suporte não é perfeito, mas, como quero acreditar, combina velocidade suficiente com qualidade suficiente. E não aumenta os preços das tarifas para quem pode ficar sem ela.



All Articles