哈布拉契人在五年内发生了什么变化?或“ 280周后”

我们变老了,恋人增加了一半半(恋人减少了三分之一),并且人们对酒精的耐受性增加了四分之一。

如果您想了解Habravites在过去5年中的变化,欢迎与我们联系。


背景


在2014年深秋,我发表了一篇文章“谁订阅了Habrahabr?”。这是我使用VK API进行练习的结果:我尽量避免参加VK中的Habr组的每个人的基础,然后进行简要分析。性别,国家,城市,年龄等等等...通常,VK中的配置文件中可用的所有内容。

Habr原来是普通订户...但是,



最好从评论中引述:一年,两年,三年过去了...我定期提醒自己,再次写同一篇文章,将Habra居民的数字与2014年底的样本进行比较,会很高兴。

最终,在这一年(2020年)的二月,我决定是时候了。但是随后,一个惊喜在等待着我。
不再可能下载Habr订户。



该怎么办?将该文章再推迟五年?好吧,我不!然后,原来的订户基础仍然存在(我将不介绍它值得记住的困难,然后再解决)。

因此,您可以进行同样有趣的比较。以2014年秋季的订阅者为例,下载其当前数据并分析这5年中同一个人的变化。

研究基地


已经获得了旧数据库并再次下载了用户数据,有必要了解一下,但是有没有人可以与之进行比较?

首先,一个人可以删除个人资料(我本人很长时间已将其删除),其次,他可以将其关闭,这意味着我无法获取数据(它也对我关闭了)。



好了,最后一点:用户可以简单地停止活动。一方面,数据可以下载。但是,如果我们已经在跟踪更改,那么吸引仍然访问VK的那些用户似乎是合理的。很少出现的用户不太可能更改调查表中的数据(老实说,活跃并不是事实)。

主动表示在过去30天内至少访问过该网站一次的人。

这就是发生的情况:



这个非常环保的袖子是我们的目标受众。他们没有离开,他们没有关闭,他们一直在活动。

我们在5年前分析的35万用户中,只有154 000个用户存活至今(约43%!)。如果添加活动但已关闭的页面,则可获得约200,000或〜58%。

老实说,类似的情况促使我思考一下整个社交网络的命运,尤其是VK的命运,但我也许会为它们专门撰写一篇文章。希望比5年后早。

因此,我们将比较153,741个在VKontakte中保持活跃并开放的用户。他们的数据来自2014年,而他们的数据则来自2020年走。

当时发生了什么变化?


标准说明
, . , , . / .

« ...». « , , 2014- , ...»

我们不会拉扯并立即查看问卷中这些字段或其他字段的不变性。
如您所知,并非配置文件中的所有字段都是必需的,因此,我们将仅比较用户在2014年及现在填写的那些字段的更改。

例。



足够多的话,让我们来看看数字。不变性

的百分比 括号中是未更改/更改字段的用户数(我记得,我们仅考虑已填写的字段)。 您可以分别讨论每个领域,这是我们将要做的。







首先,我不会考虑的领域


性别,大学,毕业年份

参数变化最小。这里几乎不需要评论。

姓名,宗教信仰,工作地点如果

您允许,我将跳过这些字段,因为它们都是文本性的,这使它们的分析大大复杂化。而且任何拼写错误或名称“ Vanya”->“ Ivan”的更改(即通常是这样更改名称)都只会阻塞样本。

就业类型和受教育程度

为了不耽误文章,我将省略这些领域。 5年过去了,这是绝对清楚的事情。学生已成为学生,学士是硕士,学生是公司的毕业生和员工。您不太可能在这里找到有趣的东西。

如果您突然想了解有关这些参数更改的信息,请在注释中写。

现在到领域,我们将对其进行详细考虑。

年龄


老实说,我认为年龄基本上从/更改为伪造日期,如01.01.1905或类似的日期。

但是,没有。让我们来看看已经改变年龄的用户。以天为单位的增量(负值-恢复活力,正值-年龄)。

分布将如下所示:



当然,正如我所期望的,几十年来一直在变化。但是大多数更改集中在零附近。仔细观察一下,间隔仅为±10年。



这些高峰是多少,我想您猜对了。 365、730、1095天...

人们希望立即改变自己的年龄数年之久,没什么。

做什么的?我知道为什么要将我的出生日期更改为有条件的1918年。一种示范“我不想显示我的出生年份,这不关你的事。”反变态也是自然的。

并将其移动几年...我没有确切的答案。只是一个假设:如果您仔细观察,他们会偏爱较小的一面,即使自己恢复活力。

而且,是的,他们不会指责我为性别歧视,而是:



分布在男女两性的左边,但是在其右侧几乎没有女性。 (如果您为男人本身具有更多的价值而感到尴尬,那么这是因为他们在哈布拉族居民中所占的比例更高)。

就是说,男女代表都喜欢将年龄改为较小的一面,而女性则更多。

性别之间的这些差异在统计学上很明显(Mann-Whitney和t检验在p <0.01上证实了这一点),但我对此感到非常惊讶。有人试图通过更改出生日期来隐藏自己的真实年龄,这似乎很奇怪。

但是,很可能我弄错了,这种行为除了渴望“恢复活力”之外还有其他原因。

另一个可能的假设是:在12岁时注册的小学生(正式注册可以在14岁开始),因此他们已经扔了几年,现在返回真实的出生日期。当然,我不会检查它(至少作为文章的一部分)。

如果您有任何想法,请在评论中告诉我还有什么我可能错过的地方。

国家


在IT部门的代表中,迁移非常普遍。

至少有150个Habr订户所属的国家才能过滤掉排放物。并查看:

  1. 该国有多少人“离开” /“抵达”
  2. 与该国家/地区相关的订户总数有何变化?



相对“增长”的领导者是荷兰和波兰。

我对荷兰一无所知,这显然是调动IT专家的不错选择(是的,几年前我的朋友搬到了那里)。为什么波兰处于领先地位,我们将在稍后找到。

流出主管-乌克兰。结果是可以理解的。

首先,如果我没记错的话,乌克兰公民现在更容易前往欧盟国家工作。
可能迁移的第二个方向是俄罗斯。 VKontakte社交网络在乌克兰被封禁,并且通常与俄罗斯关联。鉴于近年来我们国家之间发生的所有事情,可以合理地假设基本上有来自乌克兰的或多或少来自乌克兰的亲俄罗斯用户,而这很可能实际上已经转移到了俄罗斯。

让我们看看他们要离开的地点和地点(我只离开了至少有100个订户“离开”的国家/地区)。



考虑到VK是俄罗斯的社交网络,大多数离开俄罗斯的人是合乎逻辑的。顺便说一句,白俄罗斯人在去俄罗斯的人中所占的比例最小。但是很明显,为什么波兰在上一张图表中处于领先地位(乌克兰在这里也做出了贡献)。

顺便说一句,至于从乌克兰到俄罗斯的迁移,人们可以假设这种情况是克里米亚用户“转移”的结果。但是在新旧数据集中,有来自克里米亚城市的用户与俄罗斯和乌克兰都有关系(我不知道VK在这里的工作方式:是提供选择国家还是取决于注册日期,我不知道)。因此,事实并非如此。

他们更喜欢首先从俄罗斯本身“离开”到美国。名单上的下一个是乌克兰,德国和哈萨克斯坦。


既然我们在谈论移民,那么城市就需要感动。

我将只留下丰度模数的相对变化超过10%并且或多或少有大量人居住(或居住)的城市。



当然,对于卢甘斯克和顿涅茨克来说,这是非常悲惨的处境,我认为这里很清楚,没有多余的评论。

绝对数字的大量出现使它成为领先的莫斯科和圣彼得堡,而在负平衡地区,这一事实是可以预料的,什么都不能改变:



但是索契和克拉斯诺达尔的领导相对称呼感到好奇。趋向温暖气候的趋势?


如前所述,如果名称没有得到认真的纠正(基本上改变了相同名称的形式),那么姓氏通常会真实地更改。原因很明显:许多哈布拉夫昌卡已经结婚。



关系


既然我们在谈论婚姻,那么看待爱情事务的变化是合乎逻辑的。更确切地说,在“关系”领域。

以上是各种关系状态和“过去/现在”细分的用户份额。
以下是特定状态的百分比变化(百分比)。下文:变成蓝色,变成橙色。



我们已经变老了,这是合乎逻辑的,这意味着“已婚”状态的最大增加。这是唯一的变化。所有其他状态均为负。甚至恋人。
有更少的浪漫史吗?



但是,我们不要急于下结论,让我们看一下“它曾经是/变成了”这一矩阵。



变化越少,对角线越绿。但是事实并非如此,这是合乎逻辑的-在大多数情况下,恋人订婚并有伴侣结婚(因此,浪漫坠落是虚构的,他们只是做了升级)。

稳定性由“已婚”和“已婚”状态表示。而那些与一切都很复杂的人中有一半解决了他们的问题。而且几乎都有同样可能的结果:24%的用户免费并在搜索中发现了相同数量的伴侣(订婚,已婚,已婚)。将恋人带到何处到底还不清楚。爱是单相思。

政治观点


“如果20岁的时候你不是革命者,那么你就没有心...”。
五年后会发生什么?

在这里有必要预约:
. ? ? , , ? , .



正如我们所看到的,一半的哈勃拉奇教派在政治事务上仍然保持谦虚或冷漠。然后是自由主义者和君主主义者。

自由主义者的政治潮流表明了唯一的显着增长。我认为这是由于近年来该运动越来越受欢迎。但是从绝对意义上讲,它仍然是面包屑。

这次的矩阵将具有清晰的对角线。



最不稳定的是共产党员。马克思和恩格斯的戒律只有3/4。自由主义者也一样,尽管有上述提到的增长。

但是,这与保守派和社会主义者相距不远。最稳定的只是政治温和和冷漠的哈勃拉维特人。




我认为这很有趣:)随着时间的流逝,事实证明酒精并没有那么糟糕,对酒精的态度可以改变为妥协,即使不是积极的。

如果我们将“急剧下降”视为1,将“积极”比率视为5,则平均值从2.75跃升至2.87(差异将是显着的,p <0.001)。

我不知道这有什么关系。近年来,葡萄酒和啤酒(手工艺)文化的普及也许起了一定作用,而且饮酒已不再与唾液醉酒有关。也许随着年龄的增长,人们的看法变得不太激进,通常不再察觉到“严重的负面影响”。

抽烟


最后,最后一点。



与酗酒相同,但总的来说,对吸烟的态度要比对酗酒的态度要消极得多(我在上一篇文章中指出,这一事实总体上是全球趋势)。

再者,类似的假设:随着年龄的增长,您对所有事物都变得更加宽容,或者被宣称是对烟草危害较小的替代品的vapes /水烟袋和其他吸烟方法已经开始起作用。

结论


这就是全部。没有结论,文章是星期五。我只是希望您,莫斯科国立大学的29岁已婚毕业生,具有温和的政治见解,偶尔喝点酒,至少有点有趣。

All Articles