
祝所有恋人都能看到无用的图表!
我有几次听到一些精通音乐的人的看法,即听众偏向表演者的音色。
特别是,据称歌手的性别会影响我们的偏好。如果很粗鲁,那么“男孩,在其他条件相同的情况下,更喜欢多听女孩,反之亦然”。
这似乎是其中一种说法,对真实数据的验证在生活中是完全没有用的,但非常有趣。
如果您坚持相同的观点-欢迎来到Kat!
因此,有一种说法是,该组主要歌手的性别与其歌迷的性别分布之间存在某种关系。该声明基于对讲俄语的音乐爱好者的观察,他们大多听摇滚乐。因此,将说俄语的摇滚乐队的说俄语的听众带进来,并用某种控制小组将他们稀释一点是一个合理的假设。
第一个想法
精细。从哪里获取数据?首先想到的是在各个团体的音乐会照片中查看粉丝的性别构成。由于社会因素,这个想法不得不被拒绝-通常习惯由公司(包括夫妇)参加音乐会。是的,所有这些关于Stas Mikhailov音乐会上悲伤的丈夫的笑话。
, , , — . "". .
, "".
, !
- -
- ,
API
API . .
, :
- vk
- https://vk.com/apps?act=manage
- ( Standalone-, , )
- ID
- , ID
- acces token,
- ,
- , "", .
— API , , - .
, . , .
, . .
.
"". 1000 (-) .
"". 80-90 . . API .
, . "": 1000 . , .
1000 19 4 , .
, 500 .
. " ", , .
-, — 55% . 50 50 .
, bar chart .
, , .
, , confidence
h = std_err * scipy.stats.t.interval(confidence, nn-1, loc=0, scale=1)[1]/math.sqrt(nn)
,
std_err — , np.std(data)
nn —
.. , 90% ( 100 , 10 ) .

"" 1000 .
:
—
—
— "50 50"
( "", "", -).
, :
group_gender: 1 — , 2 —
mean: — , —

?
-, . , "" . , .
-, . ("", "" ""). — ("Nautilus Pompilius", "" "" ).
-, . , . (5 5) . - - . "" , , , ("", "", ""), ("-2", " " , , ""). .
?
" " — , . , .
基本的假设是“应该在最上面的组的名称”。如果您稍稍使用令牌,则可以突出显示相关组之间的“距离”。但是地板没有达到。
因此,只需以词云的形式欣赏顶部即可:
很多图片
, .

""

"" . "" "", .

. . "", .

"" .

"" . "", "" "" .

: "", "", "", .

"-2" . "".

.

"" "" , "".

.

"-" -

"Radiohead" .

"" , "", "" "" .

"" .

"" - .
从今天的建设性部分。源代码可供所有人使用。
如果要在此数据集上查看其他内容,请在注释中写。
我请你不要把这个“研究”当做不值得的事。这无非是满足我的好奇心并尝试使用新工具。