рдмрд┐рдВрджреБрдУрдВ рдХреЗ рдЗрди рджреЛ рд╕реЗрдЯреЛрдВ рдХреЛ рджреЗрдЦреЗрдВ рдФрд░ рд╕реЛрдЪреЗрдВ: рдХреМрди рд╕рд╛ рдЖрдкрдХреЛ рдЕрдзрд┐рдХ "рдпрд╛рджреГрдЪреНрдЫрд┐рдХ" рд▓рдЧрддрд╛ рд╣реИ? рдмрд╛рдИрдВ рдЖрдХреГрддрд┐ рдореЗрдВ рд╡рд┐рддрд░рдг рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдЕрд╕рдорд╛рди рд╣реИред рдРрд╕реЗ рд╕реНрдерд╛рди рд╣реИрдВ рдЬрд╣рд╛рдВ рдЕрдВрдХ рдШрдиреАрднреВрдд рд╣реЛрддреЗ рд╣реИрдВ, рдФрд░ рдРрд╕реЗ рд╕реНрдерд╛рди рднреА рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рд▓рдЧрднрдЧ рдХреЛрдИ рдмрд┐рдВрджреБ рдирд╣реАрдВ рд╣реЛрддреЗ рд╣реИрдВ: рдЗрд╕ рд╡рдЬрд╣ рд╕реЗ, рдпрд╣ рднреА рд▓рдЧ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдмрд╛рдПрдВ рдЪрд╛рд░реНрдЯ рдЧрд╣рд░рд╛ рд╣реИред рд╕рд╣реА рдЖрдВрдХрдбрд╝реЗ рдореЗрдВ, рд╕реНрдерд╛рдиреАрдп рд╕рдВрдШрдирди рдФрд░ рджреБрд░реНрд▓рдн рд╡рд╕реНрддреБрдПрдВ рднреА рдореМрдЬреВрдж рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╡реЗ рдХрдо рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╣реИрдВред

рдЗрд╕ рдмреАрдЪ, рдпрд╣ рдмрд╛рдПрдВ рдЧреНрд░рд╛рдл рдерд╛ рдЬрд┐рд╕реЗ "рдИрдорд╛рдирджрд╛рд░" рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд╕рдВрдЦреНрдпрд╛ рдЬрдирд░реЗрдЯрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рд╕рд╣реА рдЧреНрд░рд╛рдл рдореЗрдВ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдмрд┐рдВрджреБ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ; рд▓реЗрдХрд┐рди рдЗрди рдмрд┐рдВрджреБрдУрдВ рдХреЛ рдЙрддреНрдкрдиреНрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ рд╕рднреА рдЫреЛрдЯреЗ рд╡рд░реНрдЧреЛрдВ рдореЗрдВ рд╕рдорд╛рди рдЕрдВрдХ рд╣реЛрдВред
рд╕реНрддрд░реАрдХрд░рдг рд╕рд╛рдорд╛рдиреНрдп рдЖрдмрд╛рджреА рд╕реЗ рд╡рд╕реНрддреБрдУрдВ рдХрд╛ рдПрдХ рд╕рдмрд╕реЗрдЯ рдЪреБрдирдиреЗ рдХрд╛ рдПрдХ рддрд░реАрдХрд╛ рд╣реИ, рдЬреЛ рд╕рдмрд╕реЗрдЯ (рд╕реНрдЯреНрд░реЗрдЯрд╛) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рд╣реИред рд╕реНрддрд░реАрдХрд░рдг рдХреЗ рджреМрд░рд╛рди, рд╡рд╕реНрддреБрдУрдВ рдХреЛ рдЗрд╕ рддрд░рд╣ рд╕реЗ рдЪреБрдирд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдЕрдВрддрд┐рдо рдирдореВрдирд╛ рд╕реНрдЯреНрд░реИрдЯ рдХреЗ рдЖрдХрд╛рд░ рдХреЗ рдЕрдиреБрдкрд╛рдд рдХреЛ рдмрдирд╛рдП рд░рдЦрддрд╛ рд╣реИ (рдпрд╛ рдирд┐рдпрдВрддреНрд░рд┐рдд рддрд░реАрдХреЗ рд╕реЗрдЗрди рд╕рдВрдмрдВрдзреЛрдВ рдХрд╛ рдЙрд▓реНрд▓рдВрдШрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЦрдВрдб 3 рджреЗрдЦреЗрдВ)ред рдХрд╣реЗрдВ, рдорд╛рдирд╛ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╕рд╛рдорд╛рдиреНрдп рдЖрдмрд╛рджреА рдПрдХ рдЗрдХрд╛рдИ рд╡рд░реНрдЧ рдХреЗ рдЕрдВрджрд░ рдХреЗ рдмрд┐рдВрджреБ рд╣реИрдВ; рд╕реНрдЯреНрд░реЗрдЯ рдЫреЛрдЯреЗ рд╡рд░реНрдЧреЛрдВ рдХреЗ рдЕрдВрджрд░ рдмрд┐рдВрджреБрдУрдВ рдХреЗ рд╕рдореВрд╣ рд╣реИрдВред
. , . , - .
1. :

, , тАФ , 0.4. . -.

() :
import random
random.seed(100)
for i in range(500):
x, y = random.random(), random.random()
print x, y
, : , ; . , , , .
import random
random.seed(100)
cellsCount = 10
cellId = 0
for i in range(500):
cellVerticalIdx = (cellId / cellsCount) % cellsCount
cellHorizontalIdx = cellId % cellsCount
cellId += 1
left = float(cellVerticalIdx + 0) / cellsCount
right = float(cellVerticalIdx + 1) / cellsCount
top = float(cellHorizontalIdx + 1) / cellsCount
bottom = float(cellHorizontalIdx + 0) / cellsCount
x, y = random.random(), random.random()
x = left + x * (right - left)
y = bottom + y * (top - bottom)
print x, y
тАФ . , тАФ .

, , , .
, . ! , , , .
2. -
.
: , . , , . , .
: , .. . , , . , . , , тАФ .
. :

. , . , ┬л┬╗ , , . , , !
, , -, .. , . ( ), :

, , , . , , , , .
3.
-, -: , , , . A/B- , , , 0.5% , .
( , , ..), , .
Online Stratified Sampling: Evaluating Classifiers at Web-Scale Microsoft Research, .
, , .
тАФ . - .
:
, !
, - :
, . , .
, : . , - , , .

, , . - SimilarWeb Alexa - , . , . , , .
: ? ? ?
рдпрджрд┐ рдХреЛрдИ рдЙрддреНрддрд░ рдирд╣реАрдВ рд╣реИ рдпрд╛ рд╡реЗ рдЕрд╕рдВрддреЛрд╖рдЬрдирдХ рд╣реИрдВ, рддреЛ рдпрд╣ рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдЖрдкрдХреЛ рдзреЛрдЦрд╛ рджреЗрдЧрд╛ред