рдирдорд╕реНрдХрд╛рд░, рд╣реЗрдмреНрд░! рдЖрдЬ рдореИрдВ рдХреНрд▓рд╕реНрдЯрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рддрд░реАрдХреЗ рдХрд╛ рдПрдХ рдЫреЛрдЯрд╛ рд╕рд╛ рдЙрджрд╛рд╣рд░рдг рд╕рд╛рдЭрд╛ рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВред рдЗрд╕ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдкрд╛рдардХ рдХреЛ рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ рдФрд░ рдЕрдиреНрдп рдлреИрд╢рдиреЗрдмрд▓ рджрд┐рд╢рд╛рдПрдВ рдирд╣реАрдВ рдорд┐рд▓реЗрдВрдЧреАред рдпрд╣ рдЙрджрд╛рд╣рд░рдг рдЕрдиреНрдп рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдПрдХ рдЫреЛрдЯрд╛ рдФрд░ рдкреВрд░реНрдг рдХреНрд▓рд╕реНрдЯрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕рдВрджрд░реНрдн рдмрд┐рдВрджреБ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рдо рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдХреЛрдИ рднреА рджрд┐рд▓рдЪрд╕реНрдкреА - рдмрд┐рд▓реНрд▓реА рдореЗрдВ рдЖрдкрдХрд╛ рд╕реНрд╡рд╛рдЧрдд рд╣реИред
рддреБрд░рдВрдд рдПрдХ рдЖрд░рдХреНрд╖рдг рдХрд░реЗрдВ, рдпрд╣ рд▓реЗрдЦ рдХрд┐рд╕реА рднреА рддрд░рд╣ рд╕реЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрдХрд╛рджрдорд┐рдХ рд╣реЛрдиреЗ рдХрд╛ рджрд╛рд╡рд╛ рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ, рдкреНрд░рд╛рдкреНрдд рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡рд┐рд╢рд┐рд╖реНрдЯрддрд╛ рдпрд╛ рдореБрджреНрджреЗ рдХреА рдХрд╡рд░реЗрдЬ рдХреА рдкреВрд░реНрдгрддрд╛ред рд▓реЗрдЦ рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рд╢рд╛рд╕реНрддреНрд░реАрдп рдХреНрд▓рд╕реНрдЯрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдмреБрдирд┐рдпрд╛рджреА рдЪрд░рдгреЛрдВ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рдирд╛ рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рд╕рд░рд▓ рдФрд░ рд╕рд╛рд░реНрдердХ (рд╕рдВрднрд╡рддрдГ рдЕрдзрд┐рдХ рд╡рд┐рд╕реНрддреГрдд рдЕрдзреНрдпрдпрди рд╕реЗ рдкрд╣рд▓реЗ) рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдпреЛрдЧреНрдпрддрд╛ рдкрд░ рдХрд┐рд╕реА рднреА рд╕реБрдзрд╛рд░, рдЯрд┐рдкреНрдкрдгреА рдФрд░ рдкрд░рд┐рд╡рд░реНрдзрди рдХрд╛ рд╕реНрд╡рд╛рдЧрдд рд╣реИред
рдбреЗрдЯрд╛ рдкреНрд░рддрд┐ рд╡реНрдпрдХреНрддрд┐ рд╢рд░рд╛рдм рдХреА рдЦрдкрдд рдХреЗ рдкреНрд░рддрд┐рд╢рдд рдХреЗ рд░реВрдк рдореЗрдВ 2010 рдХреЗ рд▓рд┐рдП рдорд╛рджрдХ рдкреЗрдп (рдмреАрдпрд░, рд╢рд░рд╛рдм, рдЖрддреНрдорд╛рдУрдВ, рдЖрджрд┐) рджреНрд╡рд╛рд░рд╛ рдкреНрд░рддрд┐ рд╡реНрдпрдХреНрддрд┐ рджреЗрд╢ рджреНрд╡рд╛рд░рд╛ рд╢рд░рд╛рдм рдХреА рдЦрдкрдд рдХрд╛ рдПрдХ рдирдореВрдирд╛ рд╣реИред рдбреЗрдЯрд╛ рдореЗрдВ рдпрд╣ рднреА рд╢рд╛рдорд┐рд▓ рд╣реИ: рд╢реБрджреНрдз рд╢рд░рд╛рдм рдХреЗ рдЧреНрд░рд╛рдо рдореЗрдВ рдкреНрд░рддрд┐ рд╡реНрдпрдХреНрддрд┐ рдФрд╕рдд рджреИрдирд┐рдХ рд╢рд░рд╛рдм рдХреА рдЦрдкрдд рдФрд░ рдкреНрд░рддрд┐ рд╡реНрдпрдХреНрддрд┐ (рд╕рднреА рд░рд┐рдХреЙрд░реНрдб рдХрд┐рдП рдЧрдП + рдмреЗрд╣рд┐рд╕рд╛рдм) рд╢рд░рд╛рдм рдХреА рдЦрдкрдд (рдХреЗрд╡рд▓ рд╢реБрджреНрдз рд╢рд░рд╛рдм рдХреЗ рд▓реАрдЯрд░ рдореЗрдВ рдкреАрдиреЗ рд╡рд╛рд▓реЗ)ред
рдЗрд╕реА рд╕рдордп, рдкреНрд░рддреНрдпреЗрдХ рджреЗрд╢ рд╕рд╢рд░реНрдд рд░реВрдк рд╕реЗ рднреМрдЧреЛрд▓рд┐рдХ рд╕рдореВрд╣реЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИ: рдкреВрд░реНрд╡, рдХреЗрдВрджреНрд░ рдФрд░ рдкрд╢реНрдЪрд┐рдоред рд╡рд┐рднрд╛рдЬрди рд╡рд┐рднрд┐рдиреНрди рдХрд╛рд░рдгреЛрдВ рд╕реЗ рдмрд╣реБрдд рд╣реА рдордирдорд╛рдирд╛ рдФрд░ рдмрд╣реБрдд рд╡рд┐рд╡рд╛рджрд╛рд╕реНрдкрдж рд╣реИ, рд▓реЗрдХрд┐рди рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЬреЛ рд╣реИ, рдЙрд╕рд╕реЗ рдЖрдЧреЗ рдмрдврд╝реЗрдВрдЧреЗред рдбреЗрдЯрд╛ рд╕реНрд░реЛрдд - рд╢рд░рд╛рдм рдФрд░ рд╕реНрд╡рд╛рд╕реНрдереНрдп рдкрд░ рд╡реИрд╢реНрд╡рд┐рдХ рд╕реНрдерд┐рддрд┐ рд░рд┐рдкреЛрд░реНрдЯ 2014, рдПрд╕ 289-364

(рд╣рд╛рде рд╕реЗ рдкреЗрдВрдЯ рдХрд┐рдпрд╛ рд╣реБрдЖ, рддреНрд░реБрдЯрд┐рдпрд╛рдВ рд╣реЛ рд╕рдХрддреА рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рдЪрд╛рд░, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ, рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИ)
рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг
рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЧрдП рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреЛ рдХрдиреЗрдХреНрдЯ рдХрд░реЗрдВред
library(rgl)
library(heplots)
library(MVN)
library(klaR)
library('Morpho')
library(caret)
library(mclust)
library(ggplot2)
library(GGally)
library(plyr)
library(psych)
library(GPArotation)
library(ggpubr)
, .
#
data <- read.table("alcohol_data.csv", header=TRUE, sep=",")
#
rownames(data) <- make.names(data[,1], unique = TRUE)
# ,
data <- data[,-1]
data <- na.omit(data)
#
head(data)
summary(data)

, . , Other , , , , . , , , , . , . - .
, , , .
options(rgl.useNULL=TRUE)
open3d()
mfrow3d(2,2)
levelColors <- c('west'='blue', 'east'='red', 'center'='yellow')
plot3d(data$Beer, data$Wine, data$Spirit, xlab="Beer", ylab="Wine", zlab="Spirit", col = levelColors[data$Group], size=3)
widget <- rglwidget()
widget
, . , .

ggpairs(
data,
mapping = ggplot2::aes(color = data$Group),
upper = list(continuous = wrap("cor", alpha = 0.5), combo = "box"),
lower = list(continuous = wrap("points", alpha = 0.3), combo = wrap("dot", alpha = 0.4)),
diag = list(continuous = wrap("densityDiag",alpha = 0.5)),
title = "Alcohol"
)

Average Total , Average.
data <- data[, -6]
, , , , . .
data[data$Wine>60,]
, , , , - , , .
data[data$Spirit>70,]
data[data$Spirit<10,]
, , .
,
split(data[,1:5],data$Group)
$center
$east
$west
ggpairs(
data,
mapping = ggplot2::aes(color = data$Group),
diag=list(continuous="bar", alpha=0.4)
)

, , . Other, : , , , ( 10-12 , 45, , ). . , , , (). , , . Other .
, , тАФ , тАФ . , тАФ , .
Total Other, . .
, Beer, Spirit Wine . , , , . , , , , , .
Total. , тАФ .
data.group = data[,5]
data <- data[,-5]
data<- data[,-4]
Elbow method (тАЬ тАЭ, тАЬ тАЭ). , k, тАУ W(K), .
library(factoextra)
fviz_nbclust(data, kmeans, method = "wss") +
labs(subtitle = "Elbow method") +
geom_vline(xintercept = 4, linetype = 2)

data.dist <- dist((data))
hc <- hclust(data.dist, method = "ward.D2")
plot(hc, cex = 0.7)

. .
colors=c('green', 'red', 'blue')
hcd = as.dendrogram(hc)
clusMember = cutree(hc, 4)
colLab <- function(n) {
if (is.leaf(n)) {
a <- attributes(n)
labCol <- colors[data.group[n]]
attr(n, "nodePar") <- c(a$nodePar, lab.col = labCol)
}
n
}
clusDendro = dendrapply(hcd, colLab)
plot(clusDendro, main = "Cool Dendrogram", type = "triangle")
rect.hclust(hc, k = 4)

. , .
, , , 4 .
plot(clusDendro, main = "Cool Dendrogram", type = "triangle")
data.hclas_group <- factor(cutree(hc, k = 3))
rect.hclust(hc, k = 3)

, , .
library(FactoMineR)
res.pca <- PCA(data,scale.unit=T, graph = F)
fviz_pca_biplot(res.pca,
col = colors[data.hclas_group], palette = "jco",
label = "var",
ellipse.level = 0.8,
addEllipses = T,
col.var = "black",
legend.title = "groups4")

, , . , , , , . , , , k-++.
library(flexclust)
data.kk <- kcca(data, k=3, family=kccaFamily("kmeans"),
control=list(initcent="kmeanspp"))
fviz_pca_biplot(res.pca,
col.ind =as.factor(data.kk@cluster), palette = "jco",
label = "var",
ellipse.level = 0.8,
addEllipses = T,
col.var = "black", repel = TRUE,
legend.title = "clusters")

, k- . , , .
, , hclust. .

, , . . , .
. . , , , . , , . , .
рд╕реВрдЪрдирд╛ рдорд╛рдирджрдВрдб ( рдпрд╣рд╛рдВ рд╡рд░реНрдгрди ) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреНрд▓рд╕реНрдЯрд░ рдореЙрдбрд▓ рдХреА рдзрд╛рд░рдгрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдХрд░рдирд╛ рд╕рдВрднрд╡ рд╣реЛрдЧрд╛ , рд╕рд╛рде рд╣реА рдЗрд╕ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП рд╢рд╛рд╕реНрддреНрд░реАрдп рднреЗрджрднрд╛рд╡рдкреВрд░реНрдг рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВред рдпрджрд┐ рдпрд╣ рд▓реЗрдЦ рдЙрдкрдпреЛрдЧреА рдерд╛, рддреЛ рдореИрдВ рдЕрдЧрд▓реА рдХрдбрд╝реА рдкреНрд░рдХрд╛рд╢рд┐рдд рдХрд░рдиреЗ рдХреА рдпреЛрдЬрдирд╛ рдмрдирд╛ рд░рд╣рд╛ рд╣реВрдВред