Quoi économiser dans le cloud



Les nuages ​​sont à l'aise avec leur flexibilité. Nous avons besoin d'un puissant cluster informatique pendant huit heures: loué en trois clics, terminé la tâche et éteint les voitures. Malheureusement, beaucoup ne comprennent tout simplement pas l'idéologie des ressources cloud et sont souvent déçus lorsqu'ils voient des comptes à la fin du mois.

Pour optimiser les coûts, vous devez commencer par collecter de bonnes statistiques. Je vais essayer de décrire brièvement les outils appropriés pour cela.

Le principe clé de l'épargne est de désactiver tous les inutiles et de minimiser autant que possible la réserve. Je voulais penser dans le paradigme du serveur local dans l'infrastructure de l'entreprise. Si vous pouvez automatiser l'expansion et l'arrêt des ressources cloud en fonction de la charge, c'est encore mieux.

Considérez les situations où les taux fixes sont plus rentables, et quand - le concept de paiement à l'utilisation (PAYG). De plus, considérez ce que vous pouvez désactiver l'excédent et où les ressources sont le plus souvent gaspillées. Passons en revue les principaux types de ressources: CPU, RAM, disques virtuels, réseaux et sauvegardes.

Nous collectons des informations


Avant d'effectuer des actions d'optimisation, vous devez d'abord comprendre comment votre machine est chargée. Par conséquent, il est préférable de commencer par des systèmes de surveillance pour comprendre avec précision la nature de la charge. De plus, la charge doit être analysée à différentes échelles. Les données moyennes du mois seront utiles pour comprendre le degré de réservation ou le manque de ressources en général. En outre, vous pouvez prévoir les dates approximatives auxquelles la capacité actuelle cessera d'être suffisante si la charge augmente progressivement. Les données de plusieurs jours pourront montrer des fluctuations diurnes, généralement associées au cycle de vie des fuseaux horaires, et des rafales simples et nettes lorsque les ressources sont limitées.

Comment surveiller


Il existe un grand nombre de systèmes de collecte et de visualisation d'informations parmi lesquels choisir, mais je voudrais attirer l'attention sur les principaux:

  • Zabbix — . , .
  • Kibana — ELK. , , .
  • Grafana — , . , .
  • . , .




Le cloud lui-même est conçu pour économiser de l'argent, mais vous pouvez également optimiser les coûts en consommant correctement les ressources du cloud. Estimez le chargement uniforme de vos machines. Si la machine virtuelle est chargée de manière stable, tout va bien, et le tarif avec des limites fixes et une petite réserve de puissance sera le plus avantageux.


Pendant la charge de pointe, un seul cœur était impliqué. Vous pouvez économiser de l'argent sans en prendre deux.


Vous pouvez prendre deux cœurs au lieu de quatre sans perte de performances.

Si plus de 10% du temps, la machine virtuelle est inactive, vous devez essayer de compter sur le modèle PAYG. Ce n'est qu'alors que la machine doit être éteinte lorsqu'elle n'est pas utilisée. Par exemple, une fois par jour, un nœud s'active, compile le projet et se désactive à nouveau.


Tous les cœurs sont chargés uniformément. Très probablement, il sera avantageux de prendre un tarif avec un paiement fixe.

Habituellement, les tactiques d'optimisation financière ressemblent à ceci: vous divisez les éléments de votre infrastructure en éléments stables en fonction de la consommation et en éléments instables avec des charges de pointe. Nous essayons de transférer des éléments à consommation constante vers un tarif fixe, et instables vers PAYG, afin de pouvoir lisser en douceur et sans à-coups les salves individuelles.

Nous faisons de même avec différentes machines de test et expérimentales. Le plus souvent, il est plus rentable de les payer sur les ressources consommées, plutôt qu'avec un tarif fixe. Si vous trouvez une voiture qui consomme 1% de l'énergie, éteignez-la et transférez-la vers PAYG.

Vous devez comprendre que dans le cloud, vous ne payez pas la charge du processeur, mais le fait même d'utiliser des cœurs. Si vous utilisez le plan tarifaire PAYG et que vous n'avez pas besoin d'une machine virtuelle pour le moment, par exemple, vous avez effectué les tests nécessaires dessus et ne l'utilisez plus, alors il est plus logique de le désactiver et ainsi d'économiser sur le coût de la mémoire virtuelle et des processeurs.

Certains clients utilisent l'API vCloud Director pour activer et désactiver les machines virtuelles selon un calendrier afin d'économiser encore plus sur les ressources consommées. Une très bonne approche serait d'utiliser l'orchestration pour contrôler le cloud, activer et désactiver les nœuds lorsque la charge change.

Dans le même temps, vous devrez quand même payer pour des disques virtuels. Si vous n'avez plus besoin d'une machine virtuelle, il est préférable de la supprimer. Ou, si vous l'utilisez très rarement, puis pendant un certain temps, alors qu'il est éteint, transférez-le vers un stockage moins cher. Vous pouvez également économiser sur des disques virtuels si vous déployez un nœud à chaque fois à partir d'un modèle prêt à l'emploi, plutôt que de laisser le fini désactivé. Et conservez les modèles déjà dans un stockage bon marché.

RAM


Vous ne devez pas allouer plus de mémoire à la machine virtuelle que nécessaire. Très souvent, les utilisateurs du cloud configurent les machines virtuelles de manière empirique: "Eh bien, à peu près autant de mémoire doit être vidée et autant de cœurs." En même temps, c'est la RAM qui, en règle générale, est la ressource la plus chère du cloud.

En utilisant le plan tarifaire PAYG, il est logique de configurer la machine virtuelle afin qu'elle utilise de manière optimale les ressources qui lui sont allouées, avec une marge de performance pour les charges de pointe. Dans le même temps, la réserve ne doit pas être x4 ou x10 de la consommation moyenne de votre application: elle est tout simplement irrationnellement chère. Bien sûr, les limites sont toujours déterminées individuellement pour chaque tâche, mais le plus souvent, vous devez vous assurer que le stock ne dépasse pas 25%.

Disques virtuels


Une ressource importante est les disques virtuels. Il existe plusieurs types de disques virtuels dont la vitesse et le prix diffèrent. Plus le disque est rapide, plus il est cher. Par conséquent, l'enregistrement de ce paramètre doit commencer par l'analyse et la séparation des données en «froid» et «chaud».


Mauvaise option. La stratégie d'allocation de VM est configurée de sorte que le swap, la configuration et les disques de VM soient placés sur des disques coûteux, sauf indication contraire explicite.

Une machine virtuelle peut utiliser simultanément différents types de disques pouvant être placés sur un stockage rapide et lent. Par conséquent, si vous stockez une sorte d'archives de données ou de journaux, il est logique de les placer sur des disques lents. Les bases de données sont essentielles pour IOPS, nous les envoyons donc à des référentiels rapides.


L'option correcte. Chaque type de données a sa propre vitesse de disque.

Maintenant, nous devons résoudre la question sur quel disque placer la VM elle-même. La plate-forme vloud Director a une fonctionnalité: elle réserve de l'espace disque pour la RAM de la VM au moment de son lancement. Dans ce cas, vous présélectionnez le type de stockage. Le système d'exploitation lui-même n'est pas trop critique pour les IOPS, la plupart des composants sont déjà chargés dans la RAM et le disque n'est pas chargé. Cependant, si vous économisez de l'argent et que vous vous placez sur un disque lent, vous obtiendrez un long redémarrage et vous sortirez du mode veille en raison de la faible vitesse de lecture des fichiers d'échange et de configuration.

Tenez compte de ce facteur s'il est essentiel pour vous de lever rapidement la machine virtuelle après un redémarrage. Dans d'autres cas, vous pouvez enregistrer.

Disques sous la base de données


Très souvent, les disques sous la base de données sont pris «pour la croissance». Il s'agit d'une erreur typique pour les systèmes cloud. Si vous avez besoin de 60 Go, prenez-en autant que nécessaire avec une petite marge. Les 200 Go conditionnels d'un disque rapide consomment des ressources financières et inactifs.

Contrairement au serveur Iron, il n'y a aucun problème à étendre progressivement le disque en volume si nécessaire. N'oubliez pas de raccrocher la surveillance avec des déclencheurs pour déborder le disque afin de ne pas rater le moment où il est temps d'agrandir l'espace. Si vous voulez le faire très bien, vous pouvez essayer d'augmenter automatiquement l'espace au fur et à mesure qu'il se remplit via l'API.

Le seul inconvénient de cette approche est que vous ne pouvez pas réduire la taille des disques, change uniquement dans le sens de l'expansion. Si vous devez toujours le réduire, cette procédure est effectuée avec le transfert de données vers un volume plus petit et la suppression de l'ancien disque. N'oubliez pas les sauvegardes et les tests approfondis à ce stade.

N'oubliez pas de vider les journaux sur un stockage lent séparé afin de ne pas gaspiller un espace précieux sur le disque rapide de la base de données. Ils ont tendance à absorber très rapidement de l'espace, en particulier dans le cas de MS SQL. Il est également hautement souhaitable d'exclure les journaux des images des sauvegardes régulières.

Réseau


Nous faisons de même avec le réseau: nous ne recherchons pas des nombres ronds de 1-10-100 mégabits, mais prenons immédiatement 45 mégabits si vous avez une charge de canal moyenne d'environ 40. Prenez autant de ressources que nécessaire.

Clarifiez la possibilité de contrôler ce paramètre de votre part. Chez nous, le client lui-même ne peut pas le changer, c'est-à-dire que le paiement à l'utilisation ne fonctionne pas, et le changement de la largeur du canal est possible une fois par mois. Cependant, il existe des nuages ​​dans lesquels ce paramètre est configuré en temps réel.



Dans le cloud basé sur vCloud Director, il y a une grande chose à propos de NSX Edge - le routeur virtuel. Il est gratuit et peut remplacer des solutions plus coûteuses qui nécessitent une capacité supplémentaire et des licences d'achat. Il dispose d'un équilibreur qui, dans des situations simples, peut remplacer des solutions telles que Haproxy et l'appliance virtuelle Citrix NetScaler. Pas besoin d'acheter des licences pour des produits commerciaux et vous ne payez pas pour les ressources NSX Edge. C'est par défaut.

Si nécessaire, NSX Edge peut être mis à l'échelle. Capable de fonctionner comme un VPN de trois types:

  1. Tunnel VPN IPsec Site à Site - pour organiser un canal sécurisé entre le cloud et le bureau ou d'autres clouds où se trouvent les ressources du client.
  2. SSL VPN — , Checkpoint Cisco Fortigate.
  3. L2VPN — , IPSEC Site-to-Site, L2.

CPU


Ici, vous pouvez enregistrer quelques options.

Vous devez d'abord sélectionner soigneusement le type de processeur optimal en termes de fréquence et de nombre de cœurs. Tout dépendra des caractéristiques des licences logicielles qui s'exécutent sur cette machine. Par exemple, un serveur AD ou un serveur de terminaux est pratique pour conserver des hyperviseurs avec un grand nombre de cœurs de milieu de gamme. Sur les serveurs dont le logiciel est autorisé par le nombre de cœurs, la fréquence d'un seul cœur devient déjà importante. De telles machines sont plus chères, mais plus rentables en termes de performances par cœur.

Il n'est pas du tout nécessaire d'utiliser les mêmes processeurs sur toutes vos machines. De plus, une combinaison d'instances avec une fréquence centrale de 2,4 GHz et, par exemple, 3,1 GHz peut être plus attrayante économiquement.

Des architectures hybrides peuvent également être utilisées. Si vous avez votre propre infrastructure et que vous ne voulez pas tout transférer, alors une solution mixte sera une bonne solution, quand une partie tourne au bureau et l'autre dans le cloud. Dans le même temps, les ressources cloud ne sont utilisées que pour lisser la charge de pointe de leur propre infrastructure.

Veuillez noter: la RAM réduira la RAM et le CPU uniquement lorsque la VM est éteinte, sinon le système pourrait paniquer. Vous pouvez étendre les ressources sur une machine en cours d'exécution si le système d'exploitation prend en charge et le mode d'ajout à chaud est activé.

Sauvegarde


Lors de l'utilisation du service de sauvegarde, le client paie pour deux choses: pour le nombre de machines virtuelles et pour la quantité de données sur l'espace disque. Encore une fois, nous commençons par l'analyse.

Réfléchissez si vous avez besoin de copies d'Active Directory il y a un an ou si une sauvegarde quotidienne incrémentielle d'une à deux semaines suffit. Décidez combien de temps les données corrompues peuvent ne pas être détectées et configurez le stockage de sauvegarde en conséquence. Machines de travail, sur lesquelles le service ne tourne que, en règle générale, cela n'a aucun sens de stocker plus d'une semaine. Dans le cas de la base de données, il peut être nécessaire de restaurer à partir d'une copie d'il y a six mois si quelqu'un gâche les données, mais cela ne sera pas remarqué tout de suite.

Le deuxième point est la vitesse de récupération. Si le service a une réserve, vous pouvez vous limiter à une sauvegarde complète et à des copies incrémentielles. Dans ce cas, la dernière copie est restaurée, mais avant cela, toutes les modifications par rapport aux copies incrémentielles doivent être prises en compte par étapes. Ça fait longtemps. Mais dans le cas de nœuds de sauvegarde fonctionnels, le service continuera de fonctionner pendant que l'un des nœuds est restauré.

S'il n'y a pas de réserve pour une raison quelconque, alors vous devriez penser à stocker la sauvegarde complète actuelle sans incrément. Mange plus d'endroits, mais il est déployé beaucoup plus rapidement et minimise les temps d'arrêt. La différence de vitesse peut être une fois et demie à deux fois.

Si vous devez conserver les sauvegardes pendant une longue période, vous devez envisager l'option de stockage à froid. Il s'agit généralement de bibliothèques de bandes à récupération lente. L'option est idéale pour les données archivées. Un bon exemple est Amazon Glacier, où le début du déploiement à partir d'une ancienne sauvegarde commence trois à cinq heures après la demande. Conditionnellement, vos données doivent être physiquement trouvées, retirées de l'entrepôt et comptées. Mais le coût par gigaoctet de stockage devient beaucoup plus rentable.

Nous pouvons utiliser le stockage de l'installation au taux de " Single ". Il a un faible coût de stockage avec une remise progressive: plus vous stockez de stockage, moins le gigaoctet des coûts de données est bas.

Sommaire


Vous pouvez économiser des ressources sur le cloud uniquement si vous analysez soigneusement la charge et minimisez la capacité de réserve. Commencez par collecter des statistiques de haute qualité et commencez à réduire en douceur les ressources au minimum nécessaire.

Si la consommation du nœud est stable et ne change pas, accédez à votre propre infrastructure pour cette tâche ou choisissez des tarifs fixes.

N'oubliez pas la possibilité de schémas hybrides. L'utilisation de ressources cloud pour lisser les pics de charge irréguliers s'intègre presque parfaitement dans le concept de paiement à l'utilisation.

All Articles