Hacer el soporte más barato, tratando de no perder calidad

El modo de emergencia (también conocido como IPKVM), que le permite conectarse a VPS sin RDP directamente desde el nivel del hipervisor, ahorra de 15 a 20 minutos por semana.

Lo primero y más importante es no enfurecer a las personas. En todo el mundo, el soporte se divide en líneas, y el empleado debe ser el primero en probar soluciones típicas. Si la tarea está fuera de sus límites, pase la segunda línea. Entonces, entre los administradores de VDS a menudo hay personas que saben cómo pensar. A diferencia de muchos otros soportes. Bueno, al menos significativamente más a menudo. Y estructuran bien el boleto, describiendo de inmediato todo lo que se necesita. Si en la primera línea "el ojo está borroso" y accidentalmente piden encenderlo y apagarlo en respuesta a esto, esto es un fiasco.

La tarea es muy simple: hacer que el soporte de nuestro alojamiento VDS sea adecuado con un mínimo de costos. Porque somos la comida rápida del mundo de los proveedores de hosting: no hay "lamidas" especiales, precios bajos, calidad normal. Anteriormente, había una historia sobre el hecho de que con el advenimiento de Instagram nyashki tratando de automatizar la administración de cuentas y los propietarios de pequeñas empresas con contabilidad remota y el resto de las personas que no están tan entusiasmadas con la tecnología, la comunicación "como un administrador con un administrador" dejó de funcionar. Tuve que cambiar el lenguaje de la comunicación.

Ahora hablaré un poco más sobre los procesos, y sobre las inevitables conversaciones con ellos.

No enfurezca a las personas número 1


Cualquier soporte es la producción de transportadores. Llega una solicitud, el empleado de primera línea intenta inmediatamente reconocer una situación típica que ha sucedido miles de veces y que sucederá miles de veces. La probabilidad de que la aplicación sea típica es del 90%, y puede responder presionando solo un par de botones para sustituir la plantilla. Por lo general, debe ingresar algunas palabras en la plantilla, y ya está. O vaya a la interfaz de control y haga clic en un par de botones allí. En casos más complejos (transferencias de zona a zona, por ejemplo), debe realizar acciones de acuerdo con el algoritmo.

Lo que más enfurece a las personas, independientemente de otras cualidades de apoyo, es una reacción típica a una aplicación atípica. Llega un ticket donde se describe todo en detalle, hay muchos datos necesarios para tres preguntas por delante, el cliente anticipa un diálogo ... Y de acuerdo con las primeras palabras, el oficial de soporte en piloto automático toma un acorde para sustituir la plantilla "intente reiniciar, debería ayudar".

Esto es lo que abre el cerebro directamente a las personas, y es después de tales situaciones que permanecen las críticas más negativas y los comentarios enojados. Está claro que estábamos tan equivocados, y desde allí conocemos las estadísticas. En general, nos equivocamos de diferentes maneras, pero tales casos siempre son salvajes. Incluyendo para nosotros mismos. Por supuesto, nos gustaría que esto no suceda en absoluto. Pero esto no es muy posible en la práctica: cada pocas semanas, un empleado cansado de la monotonía es no, no e incluso presiona botones divertidos.

No enfurezca a las personas número 2


La segunda cosa que abre el cerebro con igual éxito es cuando nadie contesta el boleto el tiempo suficiente. En Europa, este tipo de comportamiento de apoyo es normal: tres días antes de que un incidente sea llevado al trabajo es más de lo normal. Incluso si es muy urgente y algo está ardiendo: no hay redes sociales, no hay teléfono, no hay mensajería, solo envíe un correo y espere su turno. En Rusia esto es mucho menos común, pero aún así algunos boletos están "olvidados". Al principio, SLA se puso en la primera reacción durante 15 minutos. Y esto es con 24/7 honesto. Está claro que cuando el alojamiento VDS se vuelve grande, aparece. Pero los proveedores de servicios dudosos no lo hacen. Y al principio solo teníamos dudas y solo entonces nos volvimos más o menos grandes. De acuerdo, más o menos promedio.

La primera línea son los operadores que recibieron guiones y se les enseñó a responder a situaciones típicas. Rápidamente y rápidamente clasifican los problemas e intentan en 15 minutos responder con una acción típica o informar que el ticket está funcionando y transferirlo a la segunda.

La segunda línea ya está alojando administradores, pueden hacer casi todo a mano. También hay un gerente de soporte que puede hacer todo y un poco más. La tercera línea ya son desarrolladores, obtienen tickets como "arreglar esto en la interfaz" o "tal y tal parámetro se tiene en cuenta incorrectamente".

Reduce la cantidad de aplicaciones


Por razones obvias, si desea proporcionar soporte a bajo costo, entonces no necesita aumentar la primera línea para que las personas puedan hacer frente a los scripts más rápido, sino aumentar la automatización. Entonces, en lugar de personas con guiones, hay guiones reales. Por lo tanto, una de las primeras cosas que hicimos fue automatizar los procesos de elevar una máquina virtual, escalar por recursos (incluido el disco hacia arriba y hacia abajo, pero no la frecuencia del procesador) y otras cosas similares. Cuanto más pueda el usuario desde la interfaz, más fácil será vivir la primera línea y menos podrá ser. Cuando un usuario maneja algo que está en su cuenta personal, debe hacerlo y decir cómo se puede hacer de forma independiente.

Si no necesita soporte, entonces lo hace bien.

La segunda característica que ahorra mucho tiempo es un largo llenado de la base de conocimiento. Si el usuario tiene un problema que no está incluido en la lista de acciones admitidas (la mayoría de las veces se trata de preguntas como “cómo instalar el servidor de Minecraft” o “Dónde configurar VPS en Win Server”), se escribe un artículo en la base de conocimiento. El mismo artículo detallado está escrito para todas las consultas extrañas. Por ejemplo, si un usuario solicita asistencia para eliminar el firewall incorporado de Windows Server, enviamos una lectura sobre lo que sucederá si está realmente desactivado y cómo restablecer los permisos solo para el software seleccionado. Porque el problema generalmente es que algo no puede conectarse debido a la configuración, y no con el firewall en sí. Pero explicar esto cada vez en el diálogo es muy difícil. Y de alguna manera no quiero deshabilitar el firewall, porque muy pronto perderemos la máquina virtual o el cliente.

Si algo sobre el software de aplicación en la base de conocimiento se vuelve muy visitado, entonces puede agregar el paquete de distribución al mercado para que aparezca el servicio "elevar el servidor con esto ya instalado". En realidad, se hizo así con el Docker, y así se hizo con el servidor de Minecraft. Una vez más, un botón "hazme bien" en la interfaz ahorra hasta cientos de tickets por año.

Modo de emergencia


Después de estas acciones, el daño más grave que requiere trabajo manual sigue siendo el hecho de que el usuario por alguna razón ha perdido los medios de acceso remoto al SO huésped en el hipervisor. El caso más común es una configuración de firewall incorrecta cursi, el segundo más frecuente son algunos errores que impiden que Win se inicie normalmente y lo obligan a reiniciar en Modo seguro. Y en modo seguro, RDP no está disponible por defecto.

Hicimos un modo de emergencia para este caso. De hecho, generalmente para acceder a la máquina VDS necesita tener algún tipo de cliente para el trabajo remoto. Muy a menudo estamos hablando de acceso a la consola, RDP, VNC o algo así. La desventaja de estos métodos es que no funcionan sin el sistema operativo. ¡Pero a nivel de hipervisor, podemos obtener la imagen en la pantalla y transmitir pulsaciones de teclas allí! Es cierto, esto no es enfermizo, carga el procesador (debido a la transmisión real del video), pero le permite obtener el resultado deseado.

Por lo tanto, dimos acceso al modo de emergencia a todos los usuarios, pero está limitado por la duración del uso continuo. Afortunadamente, como muestra la práctica, esta vez es suficiente para reiniciar y arreglar algo.

El resultado es aún menos tickets de soporte. Y donde el administrador puede arreglar el ticket por sí mismo, el soporte no necesita tenerlo en sus manos y comprenderlo.

Problemas restantes


Muy a menudo, los usuarios piensan que el soporte tiene algo para ellos. Por desgracia, no se puede hacer nada con esto (bueno, o no se nos ocurrió). Los dos ejemplos más comunes son los límites de recursos y la protección DDoS.

Cada máquina virtual tiene límites en la carga en el disco, la memoria y el tráfico permitido. La posibilidad de establecer límites se especifica en la oferta, los límites en sí mismos se seleccionan para que la mayoría de los usuarios trabajen en silencio, sin siquiera saberlo. Pero si de repente comienza a jugar mucho con el canal y el disco, entonces los algoritmos advierten automáticamente al usuario. Desde abril del año pasado, eliminamos el bloqueo automático. En cambio, establecer límites suaves para un período variable.

Solía ​​ser así: una advertencia, luego, si el usuario no ha prestado atención, se bloqueará automáticamente. Y en ese momento la gente se ofendió: "¿Por qué estás, este es tu sistema tiene errores, no había nada!" - y luego puede intentar comprender el software de la aplicación u ofrecer aumentar el plan de tarifas. No tenemos forma de entender el trabajo del software de aplicación, porque esto está más allá del soporte. Aunque los primeros casos fueron desarmados con los usuarios. Recuerdo especialmente aquel en el que el tramposo en YouTube tenía un troyano incorporado, y este troyano tenía un flujo de memoria. Como resultado, llegaron a la conclusión de que estos no son Heisenbags, sino problemas con los usuarios, de lo contrario nos veríamos abrumados con aplicaciones similares. Pero ni una sola persona ha admitido que podría superar los aranceles él mismo.

Una historia similar es con DDoS: escribimos que usted, querido usuario, está bajo ataque. Conecte la protección, por favor. Y el usuario: "Sí, ¡eres tú quien me ataca tú mismo!" Por supuesto, ponemos solo un usuario con DDoS para generar 300 rublos. Un negocio rentable. Sí, sé que muchas grandes empresas de alojamiento de la categoría de las más caras incluyen esta protección en la tarifa, pero no podemos hacer eso: la economía de la comida rápida dicta otros precios mínimos.

No menos a menudo, aquellos cuyos datos eliminamos no están satisfechos con el soporte.En el sentido de que se elimina legítimamente después del final del plazo pagado. Si alguien no extiende el alquiler de VDS, se enviarán algunas notificaciones con una explicación de lo que sucederá a continuación. Al final del pago, la máquina virtual se detiene, pero su imagen se guarda. Llega otro aviso, y luego un par más. La imagen se almacena durante siete días adicionales y solo luego se elimina para siempre. Entonces, hay una categoría de personas que están muy descontentas con esto. A partir de "el administrador renunció, se enviaron notificaciones a su correo, restaurar" y terminando con acusaciones de fraude y amenazas de violencia física. La razón son los mismos precios para todos los demás usuarios. Si mantenemos el mes, necesitaremos más almacenamiento. Esto significará excelentes precios para cada cliente individual. Y la economía de la comida rápida ... Bueno, ya entiendes.Y como resultado, recibimos comentarios en los foros con el espíritu de "tomó dinero, borró datos, estafadores".

Observo que tenemos una línea de tarifas premium. Allí, por supuesto, la situación es diferente, porque tomamos en cuenta los deseos del cliente y ajustamos de manera flexible tanto el límite como la eliminación si no se paga (lo llevamos a menos, solo para no bloquearlo). Ahí ya es económicamente factible, porque realmente todo sucede, y mantener un gran cliente habitual es costoso.

A veces los usuarios son maliciosos. Varias veces en nuestro sistema hubo fallas con el bloqueo de cientos de máquinas virtuales debido a algunas acciones claramente ilegítimas de los clientes. En realidad, precisamente debido a tales situaciones, necesitábamos nuestros propios controladores de red para monitorear la actividad de la red y ver que el usuario no está ejecutando un ataque desde su servidor. Monitorear tal plan es importante para que los tipos violentos no violen los límites de las máquinas virtuales vecinas.

Hay quienes banalmente envían spam, minan o violan la oferta. Luego llama al soporte y pregunta qué salió mal y por qué el automóvil está bloqueado. Si el proceso en el ticket de la captura de pantalla se llama "spam remover.exe", entonces es probable que algo salga mal. En otro lugar, cada dos semanas recibimos quejas de Sony o Lucasfilm (ahora Disney) de que alguien de nuestra máquina virtual de nuestra gama de direcciones IP distribuye una película falsa. Para tal bloqueo de una vez y devolución del dinero restante en la cuenta de la oferta (le recuerdo: la cuantización es por segundo, es decir, el saldo siempre será exacto). Y para devolver el dinero, según la ley, debe mostrar un pasaporte: esto es contra el lavado de dinero. Por alguna razón, en lugar de mostrar el pasaporte, los piratas escriben que les exprimimos el dinero, olvidando aclarar parte de las circunstancias.

Oh si. Tenemos la mejor solicitud del año: "¿Puedo probar una máquina virtual durante unos días a una tasa de 30 rublos por mes antes de la compra?"

Total


La primera línea clasifica los tickets y responde con acciones típicas. La mayor parte del descontento está aquí. Corregirlo de todos modos no funcionará, porque la base de la corrección está en la automatización del hosting, es decir, en una enorme acumulación de pedidos. Sí, tenemos más que muchos en el mercado, pero aún no es suficiente. Por lo tanto, lo mejor que se puede hacer es establecer un monitoreo de la primera línea. Monitorización de la mesa de soporte: implementación de KPI de primera línea En tiempo real, los retrasos de SLA son visibles: quién se equivoca, a menudo por qué. Los pedidos debidos a tales alertas nunca se pierden. Sí, pueden responder a un ticket con una plantilla fuera del tema, pero ya lo sabremos por comentarios.

Si el cliente lo solicita, el especialista de la segunda línea puede ir al servidor y hacer lo que el cliente necesita allí (la condición es la confirmación por una carta en la que proporcionará los datos para ingresar al servidor).

Hacemos esto muy raramente y confiamos en este trabajo solo de la mejor manera, porque queremos tener garantías de que los datos del usuario no serán dañados. Lo mejor es la segunda línea de soporte.

La primera línea tiene una base de conocimiento donde puede enviar para parecer complicado.

Una cuenta personal rica más una base de conocimiento, y ahora pudimos reducir el número de llamadas a 1–1.5 por año por cliente en promedio.

La segunda línea generalmente procesa aplicaciones complejas que requieren trabajo manual. Lo que es característico: cuanto más caro es el plan de tarifas, menos aplicaciones de este tipo hay por máquina virtual. Por lo general, porque aquellos que pueden pagar una tarifa costosa tienen especialistas en el estado o solo la mitad de los problemas no surgen debido al hecho de que hay suficiente configuración para todo. Todavía recuerdo al héroe que no instaló el Windows Server más antiguo en una configuración con 256 MB de RAM.

La segunda línea tiene un conjunto de distribuciones y un conjunto de scripts de automatización. Ambos se pueden actualizar según sea necesario.

La segunda línea y los gerentes de tarifas VIP personales pueden agregar notas al perfil del cliente. Si él es un administrador de Linux, lo escribiremos. Esta será la pista de la primera línea: el usuario sabe con certeza que esto no será un disparo en la pierna, sino una destrucción controlada.

La tercera línea rige lo más extraño. Por ejemplo, teníamos el error de que era imposible acceder a una de las funciones de su cuenta personal en Firefox. El usuario chantajeó directamente: "Si no lo arregla dentro de las 12 horas, entonces escribiré en todas las reseñas de los anfitriones". Al final resultó que, el problema estaba en el bloque de anuncios personalizado. En el lado del usuario, por extraño que parezca. Los errores complejos a menudo vienen sin detalles, y ya no pueden repetirlos. Hay detectives con una captura de pantalla: "¿Por qué estás arreglando su mes?" - "Sí, hemos estado buscando su error todo este tiempo", "Bueno, lo encontré de nuevo hoy, pero no pude repetirlo de nuevo" ...

En general, nunca se sabe dónde será una captura de pantalla del diálogo con el soporte, y si una persona llama al soporte Entonces tiene un problema. Puedes mejorar la actitud. Al menos inténtalo.

Sí, sabemos que nuestro soporte no es perfecto, pero, como quiero creer, combina suficiente velocidad con suficiente calidad. Y no aumenta los precios arancelarios para aquellos que pueden prescindir de él.



All Articles