Comment les Habrachiens ont-ils changé en 5 ans? Ou "280 semaines plus tard"

Nous avons vieilli, nous en avons eu une fois et demie de plus (nous avons un tiers de moins d'amoureux) et le nombre de personnes tolérantes à l'alcool a augmenté d'un quart.

Si vous voulez voir comment les Habrachiens ont changé en 5 ans, bienvenue chez cat.


Contexte


À la fin de l'automne 2014, j'ai publié un article "Qui est abonné à Habrahabr?" . C'était le résultat de mes exercices avec l'API VK: je me suis épargné la base de tous ceux qui étaient abonnés au groupe Habr en VK, puis j'ai brièvement analysé. Sexe, pays, ville, âge, etc. etc ... En général, tout ce qui est disponible à partir du profil dans VK.

Habr s'est avéré être un abonné moyen ... Cependant,



je préfère citer les commentaires: Un an, deux, trois se sont écoulés ... Je me suis rappelé périodiquement qu'il serait bien d'écrire à nouveau le même article, en comparant les chiffres des résidents d'habra avec des échantillons de la fin de 2014.

Enfin, en février de cette année (2020), j'ai décidé qu'il était temps. Mais une surprise m'attendait.
Télécharger les abonnés Habr ne semblait plus possible.



Que faire? De reporter l'article de cinq ans? Eh bien, moi non! L'ancienne base d'abonnés est alors restée (je ne décrirai pas quelles difficultés il valait la peine de se rappeler à ce sujet, puis de l'obtenir).

Vous pouvez donc faire une comparaison tout aussi intéressante. Prenez les abonnés de l'automne 2014, téléchargez leurs données actuelles et analysez ce qui a changé chez les mêmes personnes au cours de ces 5 années.

Base de recherche


Après avoir récupéré l'ancienne base de données et téléchargé à nouveau les données utilisateur, il fallait comprendre, mais y a-t-il quelqu'un avec qui comparer?

Premièrement, une personne peut supprimer un profil (je l'ai moi-même supprimé depuis longtemps), et deuxièmement, il peut le fermer, ce qui signifie que je ne peux pas obtenir les données (elles sont également fermées pour moi).



Eh bien et le dernier: l'utilisateur pourrait simplement cesser d'être actif. D'une part, alors quoi, les données peuvent être téléchargées. Mais si nous suivons déjà les modifications, il semble raisonnable de prendre les utilisateurs qui visitent toujours VK. Les utilisateurs apparaissant rarement sont peu susceptibles de modifier les données dans le questionnaire (et actif n'est pas un fait, pour être honnête).

Par actif, nous entendons les personnes qui ont visité le site au moins une fois au cours des 30 derniers jours.

Et c'est ce qui arrive:



Cette pochette verte très haut est notre public cible. Ils ne sont pas partis, ils n'ont pas fermé, ils ont gardé l'activité.

Sur les 350 000 que nous avons analysés il y a 5 ans, seuls ~ 154 000 utilisateurs ont survécu à ce jour (~ 43%!). Si vous ajoutez des pages actives mais fermées, vous obtenez environ 200 000 ou ~ 58%.

Une image similaire, pour être honnête, m'incite à réfléchir au sort des réseaux sociaux en général et de VK en particulier, mais je leur consacrerai peut-être un article séparé. Si tout va bien plus tôt qu'après 5 ans.

Ainsi, nous comparerons 153 741 utilisateurs qui restent actifs et ouverts dans l'immensité de VKontakte. Leurs données sont de 2014, contre leurs propres données de 2020 . Aller.

Qu'est-ce qui a changé alors?


Remarque standard
, . , , . / .

« ...». « , , 2014- , ...»

Nous ne tirerons pas et ne regarderons pas immédiatement à quel point ces champs ou d'autres champs sont invariables dans les questionnaires.
Comme vous le savez, tous les champs du profil ne sont pas obligatoires, par conséquent, nous ne comparerons que les changements pour les champs qui ont été remplis par l'utilisateur en 2014 et maintenant.

Exemple.



Assez de mots, passons aux chiffres.

Le pourcentage d' immuabilité sur le terrain.

Entre parenthèses est le nombre d'utilisateurs qui n'ont pas changé / changé le champ (je me souviens, nous ne prenons en compte que les champs remplis).



Vous pouvez parler de chaque domaine séparément, c'est ce que nous ferons.

Pour commencer, les domaines que je ne considérerai pas


Sexe, université, année d'obtention du diplôme

Les paramètres les moins modifiés. Les commentaires ne sont guère nécessaires ici.

Nom, croyances religieuses, lieu de travail

Avec votre permission, je sauterai ces champs, car ils sont tous textuels, ce qui complique grandement leur analyse. Et toute correction de faute de frappe ou changement de nom «Vanya» -> «Ivan» (à savoir, c'est ainsi que le nom est généralement changé) ne fait qu'obstruer l'échantillon.

Type d'emploi et niveau d'études

Afin de ne pas retarder l'article, je vais supprimer ces champs. 5 ans se sont écoulés et il est absolument clair ce qui s'est passé. Les élèves sont devenus étudiants, les bachelors sont maîtres, les étudiants sont diplômés et salariés des entreprises. Il est peu probable que vous puissiez trouver quelque chose d'intéressant ici.

Si vous voulez soudainement savoir quelque chose sur les changements de ces paramètres, écrivez dans les commentaires.

Et maintenant aux champs, que nous considérons en détail.

Âge


Pour être honnête, je pensais que, fondamentalement, l'âge passait de / à de fausses dates comme le 01.01.1905 ou quelque chose comme ça.

Mais non. Prenons les utilisateurs qui ont changé d'âge. Prenez le delta en jours (négatif - rajeuni vous-même, positif - vieilli).

La distribution ressemblera à ceci:



Bien sûr, il y a des changements depuis des décennies, comme je m'y attendais. Mais la plupart des changements se concentrent autour de zéro. Regardez de plus près, en laissant un intervalle de seulement ± 10 ans.



Quels sont ces sommets, je pense que vous l'avez deviné. 365, 730, 1095 jours ... Les

gens préfèrent changer leur âge tout de suite pendant des années, ce qui n'est rien.

Pourquoi? Pourquoi changer ma date de naissance pour l'année conditionnelle 1918, je comprends. Une sorte de démonstration "Je ne veux pas montrer mon année de naissance, ce n'est pas ton affaire." La métamorphose inverse est également naturelle.

Et le déplacer pendant quelques années ... Je n'ai pas de réponse exacte. Juste une hypothèse: si vous regardez de plus près, ils préfèrent changer de côté, c'est-à-dire se rajeunir un peu.

Et, oui, ils ne m'accuseront pas de sexisme, mais:



La distribution est biseautée à gauche des deux sexes, mais il n'y a presque pas de femmes sur son côté droit. (Si vous êtes gêné que les hommes eux-mêmes aient plus de valeurs, c'est parce que leur part parmi les résidents de Habra est plus élevée).

Autrement dit, les représentants des deux sexes aiment changer l'âge pour un petit côté, mais les femmes le font plus souvent.

Ces différences entre les sexes sont évidemment statistiquement significatives (ce qui est confirmé par Mann-Whitney et le test t à p <0,01), mais je suis extrêmement surpris par cela. Il semble étrange que quelqu'un essaie de cacher son âge réel dans VC en modifiant les dates de naissance.

Cependant, il est probable que je me trompe et ce comportement a d'autres raisons que le désir de "rajeunir".

Autre hypothèse possible: les écoliers qui se sont inscrits à l'âge de 12 ans (l'inscription officielle est possible à partir de 14 ans), et qui se sont donc jetés quelques années, et qui reviennent maintenant à des dates de naissance réelles. Bien sûr, je ne vais pas le vérifier (au moins dans le cadre de l'article).

Si vous avez des idées, dites-moi dans les commentaires ce que je pourrais manquer de plus.

Pays


Parmi les représentants du secteur informatique, la migration est assez courante.

Prenez les pays auxquels appartiennent au moins 150 abonnés Habr pour filtrer les émissions. Et regardez:

  1. Combien de personnes «sont parties» / «sont arrivées» dans le pays
  2. Comment le nombre total d'abonnés liés à ce pays a-t-il changé?



Les Pays-Bas et la Pologne sont les leaders de la «croissance» relative.

Je ne peux rien dire sur les Pays-Bas, apparemment une bonne option pour déménager un spécialiste informatique (oui, mon ami y a déménagé il y a quelques années). Pourquoi la Pologne est en tête, nous le saurons un peu plus tard.

Leader des sorties - Ukraine. Le résultat est compréhensible.

Premièrement, si je me souviens bien, il est désormais plus facile pour les citoyens ukrainiens de partir travailler dans les pays de l'UE.
La deuxième direction de la migration possible est la Russie. Le réseau social VKontakte est bloqué en Ukraine et est généralement associé à la Russie. Compte tenu de tout ce qui s'est passé entre nos pays ces dernières années, il est logique de supposer que des utilisateurs ukrainiens plus ou moins pro-russes sont restés en VK, qui aurait très bien pu s'installer en Russie.

Voyons où et où ils partaient (je n'ai quitté que les pays d'où au moins 100 abonnés sont partis).



La plupart de ceux qui sont partis ont déménagé en Russie, ce qui est logique, étant donné que VK est un réseau social russe. Soit dit en passant, le plus petit pourcentage de ceux qui sont partis pour la Russie est représenté par les Biélorusses. Mais il devient clair pourquoi la Pologne était en tête dans le graphique précédent (l'Ukraine a également contribué ici).

Soit dit en passant, comme pour les mouvements de l'Ukraine vers la Russie, on pourrait supposer qu'une telle image était le résultat du "transfert" d'utilisateurs de la Crimée. Mais dans l'ancien et dans le nouveau jeu de données, il y a des utilisateurs des villes de Crimée qui se rapportent à la fois à la Russie et à l'Ukraine (je ne sais pas comment VK fonctionne ici: qu'il propose de choisir un pays ou dépend de la date d'enregistrement, je ne sais pas). Ce n'est donc pas le cas.

Ils préfèrent «partir» de la Russie elle-même, tout d'abord, aux États-Unis. Les prochains sur la liste sont l'Ukraine, l'Allemagne et le Kazakhstan.

Ville


Puisque nous parlons de migration, les villes doivent être touchées.

Je ne laisserai que les villes dans lesquelles les changements relatifs d'abondance modulo étaient supérieurs à 10% et dans lesquelles vivent (ou vivaient) un nombre plus ou moins important de personnes.



Bien sûr, une situation très tragique avec Lougansk et Donetsk, je pense que tout est clair ici sans commentaires inutiles.

Le fait que l'Absolu arrive en grand nombre ce qui en fait un leader de Moscou et de Saint-Pétersbourg, alors que dans les régions à l'équilibre négatif est à prévoir, rien ne peut être changé:



mais la direction de Sotchi et de Krasnodar est relativement curieuse. La tendance à passer à des climats plus chauds?

Nom de famille


Si le nom, comme je l'ai dit ci-dessus, n'est pas corrigé sérieusement (en changeant fondamentalement les formes du même nom), alors les noms de famille changent souvent pour de vrai. Et la raison est évidente: de nombreux habravchanka se sont mariés.



Relation


Puisque nous parlons de mariage, il est logique de regarder les changements dans les affaires d'amour. Plus précisément, dans le domaine des «relations».

Ci-dessus, la part des utilisateurs selon les différents statuts des relations et selon la ventilation «était / est devenu».
Vous trouverez ci-dessous la variation du pourcentage d'un statut particulier en pourcentage. Ci-après: il est devenu bleu, il est devenu orange.



Il est logique que nous soyons devenus plus âgés, ce qui signifie l'augmentation maximale du statut de «marié». Et c'est le seul changement dans le plus. Tous les autres statuts sont devenus négatifs. Et même les amoureux.
Y a-t-il moins de romantiques?



Mais ne nous précipitons pas vers les conclusions, regardons la matrice «C'était / est devenu».



Moins il y a de changements, plus la diagonale est verte. Mais ce n'est pas le cas, ce qui est assez logique - pour la plupart des amoureux, fiancés et ayant un partenaire marié (donc la chute des romantiques est fictive, ils ont juste fait un niveau).

La stabilité est montrée par le statut de «marié» et libre. Et la moitié de ceux avec qui tout était compliqué ont résolu leurs problèmes. Et presque avec un résultat tout aussi probable: 24% des utilisateurs sont devenus libres et en recherche, ils ont trouvé le même nombre de partenaires (fiancés, mariés, mariés). Où emmener les amoureux jusqu'au bout n'est pas clair. L'amour n'est pas partagé.

Opinions politiques


"Si à 20 ans vous n'êtes pas un révolutionnaire, alors vous n'avez pas de cœur ..." Plus loin dans le texte.
Et que se passe-t-il dans 5 ans?

Ici, il est nécessaire de faire une réservation:
. ? ? , , ? , .



Comme nous pouvons le voir, la moitié des Habrachiens conservaient toujours la modération ou l'indifférence en matière politique. Viennent ensuite les libéraux et les monarchistes.

La seule croissance significative a été montrée par le courant politique libertaire. Je pense que cela est dû à la popularité croissante de ce mouvement ces dernières années. Mais en termes absolus, ce sont toujours des miettes.

La matrice sera cette fois avec une diagonale claire.



Les plus instables étaient les communistes. Les préceptes de Marx et d'Engels ne sont restés vrais que 3/4. Les libertaires ont la même chose, et ce malgré la croissance évoquée plus haut.

Mais ce n'est pas si loin des conservateurs et des socialistes. Les plus stables ne sont que les Habravites politiquement modérés et indifférents.

De l'alcool




Une image amusante, à mon avis :) Au fil du temps, il s'avère que l'alcool n'est pas si mauvais, et l'attitude à son égard peut être changée en un compromis, sinon positif.

Si nous considérons «fortement négatif» comme 1 et le rapport «positif» comme 5, alors la moyenne est passée de 2,75 à 2,87 (les différences seront significatives, p <0,001).

Je ne sais pas à quoi cela est lié. La vulgarisation de la culture du vin et de la bière (artisanat) ces dernières années a peut-être joué un rôle, et la consommation d'alcool a cessé d'être associée à l'ivresse salivaire. Et peut-être qu'avec l'âge, les gens deviennent moins radicaux dans leurs opinions et cessent généralement de percevoir quelque chose de «fortement négatif».

Fumeur


Enfin, le dernier point.



Même dynamique qu'avec l'alcool, mais en général, l'attitude à l'égard du tabac est beaucoup plus négative qu'à l'égard de l'alcool (j'ai noté ce fait dans le dernier article, dans son ensemble, une tendance mondiale).

Et encore une fois, des hypothèses similaires: soit avec l'âge vous devenez plus tolérant de tout, soit la mode des vapes / narguilés et autres méthodes de tabagisme, déclarée comme un substitut moins nocif du tabac, a fait son travail.

Conclusion


Voilà donc tout. Il n'y aura pas de conclusions, l'article est vendredi. J'espère juste que vous, un diplômé marié de 29 ans de l'Université d'État de Moscou, avec des opinions politiques modérées et sirotant parfois du vin, était au moins un peu intéressant.

All Articles