рдбреЗрдЯрд╛ рд╕рд╛рдЗрдВрд╕ рдореЗрдВ рдЖрдкрдХрд╛ рдкрд╣рд▓рд╛ рдХрджрдоред рдЯрд╛рдЗрдЯреИрдирд┐рдХ

рдПрдХ рдЫреЛрдЯрд╛ рд╕рд╛ рдкрд░рд┐рдЪрдп


рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛрд╣реИ рдХрд┐ рд╣рдо рдФрд░ рдЪреАрдЬреЗрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдпрджрд┐ рд╣рдореЗрдВ рдЪрд░рдг-рджрд░-рдЪрд░рдг рдирд┐рд░реНрджреЗрд╢ рджрд┐рдП рдЧрдП рд╣реИрдВ рдЬреЛ рдмрддрд╛рдПрдЧрд╛ рдХрд┐ рдХреНрдпрд╛ рдФрд░ рдХреИрд╕реЗ рдХрд░рдирд╛ рд╣реИред рдореИрдВ рдЦреБрдж рдЕрдкрдиреЗ рдЬреАрд╡рди рдореЗрдВ рдЙрди рдХреНрд╖рдгреЛрдВ рдХреЛ рдпрд╛рдж рдХрд░рддрд╛ рд╣реВрдВ рдЬрдм рдПрдХ рд╡реНрдпрд╡рд╕рд╛рдп рдЗрд╕ рддрдереНрдп рдХреЗ рдХрд╛рд░рдг рд╢реБрд░реВ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рдерд╛ рдХрд┐ рдпрд╣ рд╕рдордЭрдирд╛ рдореБрд╢реНрдХрд┐рд▓ рдерд╛ рдХрд┐ рдХрд╣рд╛рдВ рд╕реЗ рд╢реБрд░реВ рдХрд░рдирд╛ рд╣реИред рд╢рд╛рдпрдж, рдПрдХ рдмрд╛рд░ рдЗрдВрдЯрд░рдиреЗрдЯ рдкрд░ рдЖрдкрдиреЗ "рдбреЗрдЯрд╛ рд╕рд╛рдЗрдВрд╕" рд╢рдмреНрджреЛрдВ рдХреЛ рджреЗрдЦрд╛ рдФрд░ рдлреИрд╕рд▓рд╛ рдХрд┐рдпрд╛ рдХрд┐ рдЖрдк рдЗрд╕рд╕реЗ рдмрд╣реБрдд рджреВрд░ рд╣реИрдВ, рдФрд░ рдЬреЛ рд▓реЛрдЧ рдРрд╕рд╛ рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рд╡реЗ рдХрд╣реАрдВ рдФрд░ рджреБрдирд┐рдпрд╛ рдореЗрдВ рд╣реИрдВред рддреЛ рдирд╣реАрдВ, рд╡реЗ рдпрд╣реАрдВ рд╣реИрдВред рдФрд░, рд╢рд╛рдпрдж, рдЗрд╕ рдХреНрд╖реЗрддреНрд░ рдХреЗ рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж, рдЖрдкрдХреЗ рдлрд╝реАрдб рдореЗрдВ рдПрдХ рд▓реЗрдЦ рджрд┐рдЦрд╛рдИ рджрд┐рдпрд╛ рд╣реИред рдРрд╕реЗ рдХрдИ рдкрд╛рдареНрдпрдХреНрд░рдо рд╣реИрдВ рдЬреЛ рдЖрдкрдХреЛ рдЗрд╕ рд╢рд┐рд▓реНрдк рдХреЗ рд╕рд╛рде рд╕рд╣рдЬ рд╣реЛрдиреЗ рдореЗрдВ рдорджрдж рдХрд░реЗрдВрдЧреЗ, рдпрд╣рд╛рдВ рдореИрдВ рдЖрдкрдХреЛ рдкрд╣рд▓рд╛ рдХрджрдо рдЙрдард╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░реВрдВрдЧрд╛ред

рдЕрдЪреНрдЫрд╛, рдХреНрдпрд╛ рдЖрдк рддреИрдпрд╛рд░ рд╣реИрдВ? рдореБрдЭреЗ рддреБрд░рдВрдд рдХрд╣рдирд╛ рд╣реЛрдЧрд╛ рдХрд┐ рдЖрдкрдХреЛ рдкрд╛рдпрдерди 3 рдХреЛ рдЬрд╛рдирдирд╛ рд╣реЛрдЧрд╛, рдХреНрдпреЛрдВрдХрд┐ рдореИрдВ рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣рд╛рдВ рдХрд░реВрдВрдЧрд╛ред рдФрд░ рд╕рд╛рде рд╣реА рдореИрдВ рдЖрдкрдХреЛ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдкрд░ рдкреНрд░реА-рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдиреЗ рдпрд╛ рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд┐рдП рд╕рд▓рд╛рд╣ рджреЗрддрд╛ рд╣реВрдВ рдХрд┐ Google рдХреЛрд▓рд╛рдм рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВред

рдкрд╣рд▓рд╛ рдХрджрдо


рдЫрд╡рд┐

рдХрд╛рдЧрд▓ рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ рдЖрдкрдХреЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╣рд╛рдпрдХ рд╣реИрдВред рд╕рд┐рджреНрдзрд╛рдВрдд рд░реВрдк рдореЗрдВ, рдЖрдк рдЗрд╕рдХреЗ рдмрд┐рдирд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдореИрдВ рдЗрд╕ рдмрд╛рд░реЗ рдореЗрдВ рдПрдХ рдЕрдиреНрдп рд▓реЗрдЦ рдореЗрдВ рдмрд╛рдд рдХрд░реВрдВрдЧрд╛ред рдпрд╣ рд╡рд╣ рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рд╕рд╛рдЗрдВрд╕ рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛ рдХреЛ рд╣реЛрд╕реНрдЯ рдХрд░рддрд╛ рд╣реИред рд╢реБрд░реБрдЖрддреА рдЪрд░рдгреЛрдВ рдореЗрдВ рдРрд╕реА рдкреНрд░рддреНрдпреЗрдХ рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛ рдореЗрдВ рдЖрдкрдХреЛ рд╡рд┐рднрд┐рдиреНрди рд╕рдорд╕реНрдпрд╛рдУрдВ, рд╡рд┐рдХрд╛рд╕ рдХреЗ рдЕрдиреБрднрд╡ рдФрд░ рдЯреАрдо рд╡рд░реНрдХ рдХреЗ рдЕрдиреБрднрд╡ рдХреЛ рд╕реБрд▓рдЭрд╛рдиреЗ рдореЗрдВ рдПрдХ рдЕрд╡рд╛рд╕реНрддрд╡рд┐рдХ рдорд╛рддреНрд░рд╛ рдкреНрд░рд╛рдкреНрдд рд╣реЛрдЧреА, рдЬреЛ рд╣рдорд╛рд░реЗ рд╕рдордп рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИред

рд╣рдо рдЕрдкрдирд╛ рдХрд╛рдо рд╡рд╣реАрдВ рд╕реЗ рдХрд░реЗрдВрдЧреЗред рдЗрд╕реЗ рдРрд╕рд╛ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ: "рдЯрд╛рдЗрдЯреИрдирд┐рдХред" рд╢рд░реНрдд рдпрд╣ рд╣реИ: рдкреНрд░рддреНрдпреЗрдХ рд╡реНрдпрдХреНрддрд┐ рдХреЗ рдЬреАрд╡рд┐рдд рд░рд╣рдиреЗ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ред рд╕рд╛рдорд╛рдиреНрдпрддрдпрд╛, рдбреАрдПрд╕ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╡реНрдпрдХреНрддрд┐ рдХрд╛ рдХрд╛рд░реНрдп рдбреЗрдЯрд╛ рдХрд╛ рд╕рдВрдЧреНрд░рд╣, рдЙрдирдХрд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг, рдореЙрдбрд▓ рдкреНрд░рд╢рд┐рдХреНрд╖рдг, рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдФрд░ рдЗрд╕реА рддрд░рд╣ рд╣реЛрддрд╛ рд╣реИред рдХрдЧреНрдЧрд▓ рдореЗрдВ, рд╣рдореЗрдВ рдбреЗрдЯрд╛ рд╕рдВрдЧреНрд░рд╣ рдЪрд░рдг рдХреЛ рдЫреЛрдбрд╝рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рд╣реИ - рд╡реЗ рдордВрдЪ рдкрд░ рдкреНрд░рд╕реНрддреБрдд рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред рд╣рдореЗрдВ рдЙрдиреНрд╣реЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдФрд░ рдЖрдк рдЖрд░рдВрдн рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ!

рдЖрдк рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:

рдбреЗрдЯрд╛ рдЯреИрдм рдореЗрдВ рд╡реЗ рдлрд╝рд╛рдЗрд▓реЗрдВ рд╣реЛрддреА рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рдбреЗрдЯрд╛

рдЫрд╡рд┐

рдЫрд╡рд┐

рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рдЧрдпрд╛ рдбреЗрдЯрд╛ рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╣рдорд╛рд░реЗ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдХреЛ рддреИрдпрд╛рд░ рдХрд░рддрд╛ рд╣реИ рдФрд░ ...

рджреВрд╕рд░рд╛ рдХрджрдо


рдЕрдм рд╣рдо рдЗрд╕ рдбреЗрдЯрд╛ рдХреЛ рдХреИрд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░реЗрдВрдЧреЗ?

рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд╣рдо рдЖрд╡рд╢реНрдпрдХ рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреЛ рдЖрдпрд╛рдд рдХрд░рддреЗ рд╣реИрдВ:

import pandas as pd
import numpy as np

рдкрдВрдбреЛрдВ рд╣рдореЗрдВ рдЖрдЧреЗ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП .csv рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреЛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрдЧрд╛ред

Numpy рдХреЛ рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЗ рд╕рд╛рде рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХреЗ рд░реВрдк рдореЗрдВ рд╣рдорд╛рд░реА рдбреЗрдЯрд╛ рддрд╛рд▓рд┐рдХрд╛ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред
рдЖрдЧреЗ рдмрдврд╝реЛред Train.csv рдлрд╝рд╛рдЗрд▓ рд▓реЗрдВ рдФрд░ рдЙрд╕реЗ рд╣рдореЗрдВ рдЕрдкрд▓реЛрдб рдХрд░реЗрдВ:

dataset = pd.read_csv('train.csv')

рд╣рдо рдбреЗрдЯрд╛рд╕реЗрдЯ рд╡реЗрд░рд┐рдПрдмрд▓ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЕрдкрдиреА рдирдореВрдирд╛ рдЯреНрд░реЗрди.рдПрд╕рд╕реАрд╡реА рдбреЗрдЯрд╛ рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд░реЗрдВрдЧреЗред рдЖрдЗрдП рдПрдХ рдирдЬрд░ рдбрд╛рд▓рддреЗ рд╣реИрдВ рдХрд┐ рд╡рд╣рд╛рдВ рдХреНрдпрд╛ рд╕реНрдерд┐рдд рд╣реИ:

dataset.head()

рдЫрд╡рд┐

рд╕рд┐рд░ () рдлрд╝рдВрдХреНрд╢рди рд╣рдореЗрдВ рдбреЗрдЯрд╛ рдлрд╝реНрд░реЗрдо рдХреА рдкрд╣рд▓реА рдХреБрдЫ рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЛ рджреЗрдЦрдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред

рдмрдЪреЗ рд╣реБрдП рдХреЙрд▓рдо рдХреЗрд╡рд▓ рд╣рдорд╛рд░реЗ рдкрд░рд┐рдгрд╛рдо рд╣реИрдВ, рдЬреЛ рдЗрд╕ рдбреЗрдЯрд╛ рдлрд╝реНрд░реЗрдо рдореЗрдВ рдЬрд╛рдиреЗ рдЬрд╛рддреЗ рд╣реИрдВред рд╕рдорд╕реНрдпрд╛ рдХреЗ рдореБрджреНрджреЗ рдкрд░, рд╣рдореЗрдВ test.csv рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕рд░реНрд╡рд╛рдЗрд╡рд▓ рдХреЙрд▓рдо рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдпрд╣ рдбреЗрдЯрд╛ рдЯрд╛рдЗрдЯреИрдирд┐рдХ рдХреЗ рдЕрдиреНрдп рдпрд╛рддреНрд░рд┐рдпреЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╛рдирдХрд╛рд░реА рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рдирдХреЗ рд▓рд┐рдП рд╣рдо, рдирд┐рд░реНрдгрдпрдХрд░реНрддрд╛, рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд╣реАрдВ рдЬрд╛рдирддреЗ рд╣реИрдВред

рдЗрд╕рд▓рд┐рдП, рд╣рдо рдЕрдкрдиреА рддрд╛рд▓рд┐рдХрд╛ рдХреЛ рдирд┐рд░реНрднрд░ рдФрд░ рд╕реНрд╡рддрдВрддреНрд░ рдбреЗрдЯрд╛ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВрдЧреЗред рдпрд╣рд╛рдВ рд╕рдм рдХреБрдЫ рд╕рд░рд▓ рд╣реИред рдЖрд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рд╡рд╣ рдбреЗрдЯрд╛ рд╣реИ рдЬреЛ рдкрд░рд┐рдгрд╛рдореЛрдВ рдореЗрдВ рд╕реЗ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИред рд╕реНрд╡рддрдВрддреНрд░ рдбреЗрдЯрд╛ рд╡рд╣ рдбреЗрдЯрд╛ рд╣реИ рдЬреЛ рдкрд░рд┐рдгрд╛рдо рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдРрд╕рд╛ рдбреЗрдЯрд╛ рд╕реЗрдЯ рд╣реИ:

тАЬрд╡реЛрд╡рд╛ рдиреЗ рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рд╕рд┐рдЦрд╛рдпрд╛ - рдирд╣реАрдВред
рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдкрд░ рдкреНрд░рд╛рдкреНрдд Vova 2. "

рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░рд╢реНрди рдХреЗ рдЙрддреНрддрд░ рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИ: рдХреНрдпрд╛ Vova рдиреЗ рдХрдВрдкреНрдпреВрдЯрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдкрдврд╝рд╛рдпрд╛ рдерд╛? рдпрд╣ рд╕реНрдкрд╖реНрдЯ рд╣реИ? рдЖрдЧреЗ рдмрдврд╝рддреЗ рд╣реБрдП, рд╣рдо рд▓рдХреНрд╖реНрдп рдХреЗ рдХрд░реАрдм рд╣реИрдВ!

рд╕реНрд╡рддрдВрддреНрд░ рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЪрд░ рдПрдХреНрд╕ред рдирд┐рд░реНрднрд░ рдХреЗ рд▓рд┐рдП, y рд╣реИред

рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд░рддреЗ рд╣реИрдВ:

X = dataset.iloc[ : , 2 : ]
y = dataset.iloc[ : , 1 : 2 ]

рдпрд╣ рдХреНрдпрд╛ рд╣реИ? рдЗрд▓реЛрдХ [:, 2:] рдлрд╝рдВрдХреНрд╢рди рдХреЗ рд╕рд╛рде, рд╣рдо рдЕрдЬрдЧрд░ рдХреЛ рдмрддрд╛рддреЗ рд╣реИрдВ: рдореИрдВ рдЪрд░ рдПрдХреНрд╕ рдореЗрдВ рджреВрд╕рд░реЗ рдХреЙрд▓рдо рд╕реЗ рд╢реБрд░реВ рд╣реЛрдиреЗ рд╡рд╛рд▓реЗ рдбреЗрдЯрд╛ (рд╕рдорд╛рд╡реЗрд╢реА рдФрд░ рдмрд╢рд░реНрддреЗ рдХрд┐ рд╢реВрдиреНрдп рд╕реЗ рд╢реБрд░реВ рд╣реЛрддрд╛ рд╣реИ) рдХреЛ рджреЗрдЦрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВред рджреВрд╕рд░реА рдкрдВрдХреНрддрд┐ рдореЗрдВ рд╣рдо рдХрд╣рддреЗ рд╣реИрдВ рдХрд┐ рд╣рдо рдкрд╣рд▓реЗ рдХреЙрд▓рдо рдХреЗ рдбреЗрдЯрд╛ рдореЗрдВ рджреЗрдЦрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред

[a: b, c: d] рдПрдХ рдирд┐рд░реНрдорд╛рдг рд╣реИ рдЬреЛ рд╣рдо рдХреЛрд╖реНрдардХ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдпрджрд┐ рдЖрдк рдХреЛрдИ рдЪрд░ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рд╡реЗ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░рд╣реЗрдВрдЧреЗред рдпрд╣реА рд╣реИ, рд╣рдо рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ: [:, d] рдФрд░ рдлрд┐рд░ рд╣рдо рдбреЗрдЯрд╛ рдХреЙрд▓рдо рдореЗрдВ рд╕рднреА рдХреЙрд▓рдо рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВрдЧреЗ, рд╕рд┐рд╡рд╛рдп рдЙрди рдХреЗ рдЬреЛ рдХрд┐ рдЬрд╛рддреЗ рд╣реИрдВ, рд╕рдВрдЦреНрдпрд╛ d рд╕реЗ рд╢реБрд░реВ рдФрд░ рдЖрдЧреЗред рдЪрд░ рдФрд░ рдмреА рддрд╛рд░ рдХреЛ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╣рдо рд╕рднреА рдХреЛ рдЙрдирдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ, рдЗрд╕рд▓рд┐рдП рд╣рдо рдЗрд╕ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдХреЛ рдЫреЛрдбрд╝ рджреЗрддреЗ рд╣реИрдВред

рджреЗрдЦрддреЗ рд╣реИ рдХреНрдпрд╛ рд╣реБрдЖ:

X.head()

рдЫрд╡рд┐

y.head()

рдЫрд╡рд┐

рдЗрд╕ рдЫреЛрдЯреЗ рд╕реЗ рдкрд╛рда рдХреЛ рд╕рд░рд▓ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо рдЙрди рд╕реНрддрдВрднреЛрдВ рдХреЛ рд╣рдЯрд╛ рджреЗрдВрдЧреЗ рдЬрд┐рдирдХреЗ рд▓рд┐рдП рд╡рд┐рд╢реЗрд╖ "рджреЗрдЦрднрд╛рд▓" рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ, рдпрд╛ рд╡реЗ рдЕрд╕реНрддрд┐рддреНрд╡ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВред рдЙрдирдореЗрдВ рдЯрд╛рдЗрдк str рдХрд╛ рдбреЗрдЯрд╛ рд╣реЛрддрд╛ рд╣реИред

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X.drop(count, inplace=True, axis=1)

рдЙрддреНрддрдо! рд╣рдо рдЕрдЧрд▓реЗ рдЪрд░рдг рдкрд░ рдЬрд╛рддреЗ рд╣реИрдВред

рддреАрд╕рд░рд╛ рдХрджрдо


рдпрд╣рд╛рдВ рд╣рдореЗрдВ рдЕрдкрдиреЗ рдбреЗрдЯрд╛ рдХреЛ рдЗрдирдХреЛрдб рдХрд░рдирд╛ рд╣реЛрдЧрд╛ рддрд╛рдХрд┐ рдорд╢реАрди рдмреЗрд╣рддрд░ рдврдВрдЧ рд╕реЗ рд╕рдордЭ рд╕рдХреЗ рдХрд┐ рдпрд╣ рдбреЗрдЯрд╛ рдкрд░рд┐рдгрд╛рдо рдХреЛ рдХреИрд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИред рд▓реЗрдХрд┐рди рд╣рдо рд╕рдм рдХреБрдЫ рд╕рд╛рдВрдХреЗрддрд┐рдХ рд╢рдмреНрджреЛрдВ рдореЗрдВ рдмрджрд▓рдирд╛ рдирд╣реАрдВ рдХрд░реЗрдВрдЧреЗ, рд▓реЗрдХрд┐рди рдХреЗрд╡рд▓ str рдкреНрд░рдХрд╛рд░ рдХреЗ рдбреЗрдЯрд╛ рдЬреЛ рд╣рдордиреЗ рдЫреЛрдбрд╝рд╛ рдерд╛ред рдХреЙрд▓рдо "рд╕реЗрдХреНрд╕"ред рд╣рдо рдХреИрд╕реЗ рдПрдирдХреЛрдб рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ? рд╡реЗрдХреНрдЯрд░ рджреНрд╡рд╛рд░рд╛ рдорд╛рдирд╡ рд▓рд┐рдВрдЧ рдкрд░ рдбреЗрдЯрд╛ рдХреА рдХрд▓реНрдкрдирд╛ рдХрд░реЗрдВ: 10 - рдкреБрд░реБрд╖, 01 - рдорд╣рд┐рд▓рд╛ред

рдЖрд░рдВрдн рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо рдЕрдкрдиреЗ рддрд╛рд▓рд┐рдХрд╛рдУрдВ рдХреЛ NumPy рдореИрдЯреНрд░рд┐рдХреНрд╕ рдореЗрдВ рдЕрдиреБрд╡рд╛рдж рдХрд░реЗрдВрдЧреЗ:

X = np.array(X)
y = np.array(y)

рдФрд░ рдЕрдм рд╣рдо рджреЗрдЦрддреЗ рд╣реИрдВ:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X))

рд╕реНрдХреЗрд▓реЗрд░рди рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдПрдХ рдРрд╕реА рдЕрдЪреНрдЫреА рд▓рд╛рдЗрдмреНрд░реЗрд░реА рд╣реИ рдЬреЛ рд╣рдореЗрдВ рдбрд╛рдЯрд╛ рд╕рд╛рдЗрдВрд╕ рдореЗрдВ рдкреВрд░рд╛ рдХрд╛рдо рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддреА рд╣реИред рдЗрд╕рдореЗрдВ рдмрдбрд╝реА рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рджрд┐рд▓рдЪрд╕реНрдк рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдореЙрдбрд▓ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ, рдФрд░ рд╣рдореЗрдВ рдбреЗрдЯрд╛ рддреИрдпрд╛рд░ рдХрд░рдиреЗ рдХреА рднреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред

OneHotEncoder рд╣рдореЗрдВ рдЙрд╕ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдореЗрдВ рд╡реНрдпрдХреНрддрд┐ рдХреЗ рд▓рд┐рдВрдЧ рдХреЛ рдПрдирдХреЛрдб рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрдЧрд╛, рдЬреИрд╕рд╛ рдХрд┐ рд╣рдордиреЗ рд╡рд░реНрдгрд┐рдд рдХрд┐рдпрд╛ рд╣реИред 2 рд╡рд░реНрдЧ рдмрдирд╛рдП рдЬрд╛рдПрдВрдЧреЗ: рдкреБрд░реБрд╖, рдорд╣рд┐рд▓рд╛ред рдпрджрд┐ рд╡реНрдпрдХреНрддрд┐ рдПрдХ рдЖрджрдореА рд╣реИ, рддреЛ 1 рдХреЛ рдХреНрд░рдорд╢рдГ "рдкреБрд░реБрд╖" рдХреЙрд▓рдо рдореЗрдВ рд▓рд┐рдЦрд╛ рдЬрд╛рдПрдЧрд╛, рдФрд░ 0, рдХреНрд░рдорд╢рдГред

OneHotEncoder () рдХреЗ рдмрд╛рдж, рдЗрд╕рдХреА рд▓рд╛рдЧрдд [1] - рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рд╣рдо рдХреЙрд▓рдо рдирдВрдмрд░ 1 (рд╕реНрдХреНрд░реИрдЪ рд╕реЗ рдЧрд┐рдирддреА) рдХреЛ рдПрдиреНрдХреЛрдб рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред

рдЙрддреНрддрдоред рд╣рдо рдФрд░ рднреА рдЖрдЧреЗ рдмрдврд╝рддреЗ рд╣реИрдВ!

рдПрдХ рдирд┐рдпрдо рдХреЗ рд░реВрдк рдореЗрдВ, рдРрд╕рд╛ рд╣реЛрддрд╛ рд╣реИ рдХрд┐ рдХреБрдЫ рдбреЗрдЯрд╛ рдЦрд╛рд▓реА рд░рд╣рддрд╛ рд╣реИ (рдЕрд░реНрдерд╛рдд, NaN - рд╕рдВрдЦреНрдпрд╛ рдирд╣реАрдВ)ред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдХрд┐рд╕реА рд╡реНрдпрдХреНрддрд┐ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╛рдирдХрд╛рд░реА рд╣реИ: рдЙрд╕рдХрд╛ рдирд╛рдо, рд▓рд┐рдВрдЧред рд▓реЗрдХрд┐рди рдЙрд╕рдХреА рдЙрдореНрд░ рдХрд╛ рдХреЛрдИ рдЖрдВрдХрдбрд╝рд╛ рдирд╣реАрдВ рд╣реИред рдЗрд╕ рд╕реНрдерд┐рддрд┐ рдореЗрдВ, рд╣рдо рдЗрд╕ рдкрджреНрдзрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВрдЧреЗ: рд╣рдо рд╕рднреА рд╕реНрддрдВрднреЛрдВ рдХреЗ рдЕрдВрдХрдЧрдгрд┐рддреАрдп рдорд╛рдзреНрдп рдЬреНрдЮрд╛рдд рдХрд░рддреЗ рд╣реИрдВ рдФрд░, рдпрджрд┐ рд╕реНрддрдВрдн рдореЗрдВ рдХреБрдЫ рдбреЗрдЯрд╛ рдЧрд╛рдпрдм рд╣реИ, рддреЛ рдЕрдВрдХрдЧрдгрд┐рдд рдорд╛рдзреНрдп рдХреЗ рд╕рд╛рде рд╢реВрдиреНрдп рднрд░реЗрдВред

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X)
X = imputer.transform(X)

рдЕрдм рдЖрдЗрдП рдЗрд╕ рдмрд╛рдд рдкрд░ рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдРрд╕реА рд╕реНрдерд┐рддрд┐рдпрд╛рдВ рддрдм рд╣реЛрддреА рд╣реИрдВ рдЬрдм рдбреЗрдЯрд╛ рдмрд╣реБрдд рдЕрдзрд┐рдХ рдмрд┐рдЦрд░рд╛ рд╣реБрдЖ рд╣реЛрддрд╛ рд╣реИред рдХреБрдЫ рдбреЗрдЯрд╛ рдЕрдВрддрд░рд╛рд▓ [0: 1] рдореЗрдВ рд╣реИ, рдФрд░ рдХреБрдЫ рд╕реИрдХрдбрд╝реЛрдВ рдФрд░ рд╣рдЬрд╛рд░реЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд╛ рд╕рдХрддреЗ рд╣реИрдВред рдЗрд╕ рддрд░рд╣ рдХреЗ рдкреНрд░рд╕рд╛рд░ рдХреЛ рдмрд╛рд╣рд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдФрд░ рдЧрдгрдирд╛ рдореЗрдВ рдХрдВрдкреНрдпреВрдЯрд░ рдЕрдзрд┐рдХ рд╕рдЯреАрдХ рдерд╛, рд╣рдо рдбреЗрдЯрд╛ рдХреЛ рд╕реНрдХреЗрд▓ рдХрд░реЗрдВрдЧреЗ, рд╕реНрдХреЗрд▓ рдХрд░реЗрдВрдЧреЗред рд╕рднреА рд╕рдВрдЦреНрдпрд╛ рддреАрди рд╕реЗ рдЕрдзрд┐рдХ рдирд╣реАрдВ рд╣реЛрдиреЗ рджреЗрдВред рдРрд╕рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдлрд╝рдВрдХреНрд╢рди StandartScaler рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВред

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X[:, 2:] = sc.fit_transform(X[:, 2:])

рдЕрдм рд╣рдорд╛рд░рд╛ рдбреЗрдЯрд╛ рдЗрд╕ рддрд░рд╣ рджрд┐рдЦрддрд╛ рд╣реИ:

рдЫрд╡рд┐

рдХреНрд▓рд╛рд╕ред рд╣рдо рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдЕрдкрдиреЗ рд▓рдХреНрд╖реНрдп рдХреЗ рдХрд░реАрдм рд╣реИрдВ!

рдЪреМрдерд╛ рдЪрд░рдг


рд╣рдорд╛рд░реЗ рдкрд╣рд▓реЗ рдореЙрдбрд▓ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░реЗрдВ! рд╕реНрдХреЗрд▓реЗрд░ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рд╕реЗ рд╣рдореЗрдВ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рджрд┐рд▓рдЪрд╕реНрдк рдЪреАрдЬреЗрдВ рдорд┐рд▓ рд╕рдХрддреА рд╣реИрдВред рдореИрдВрдиреЗ рдЗрд╕ рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП рдЧреНрд░реЗрдбрд┐рдПрдВрдЯ рдмреВрд╕реНрдЯрд┐рдВрдЧ рдХреНрд▓рд╛рд╕рд┐рдлрд╛рдпрд░ рдореЙрдбрд▓ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ред рд╣рдо рдПрдХ рд╡рд░реНрдЧреАрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рдХреНрдпреЛрдВрдХрд┐ рд╣рдорд╛рд░рд╛ рдХрд╛рд░реНрдп рдПрдХ рд╡рд░реНрдЧреАрдХрд░рдг рдХрд╛рд░реНрдп рд╣реИред 1 (рдЙрддреНрддрд░рдЬреАрд╡рд┐рддрд╛) рдпрд╛ 0 (рдЬреАрд╡рд┐рдд рдирд╣реАрдВ рд░рд╣рдиреЗ) рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛рдирд╛ рдЖрд╡рд╢реНрдпрдХ рд╣реИред

from sklearn.ensemble import GradientBoostingClassifier
gbc = GradientBoostingClassifier(learning_rate=0.5, max_depth=5, n_estimators=150)
gbc.fit(X, y)

рдлрд┐рдЯ рдлрд╝рдВрдХреНрд╢рди рдЕрдЬрдЧрд░ рдХреЛ рдмрддрд╛рддрд╛ рд╣реИ: рдореЙрдбрд▓ рдХреЛ рдПрдХреНрд╕ рдФрд░ рд╡рд╛рдИ рдХреЗ рдмреАрдЪ рдирд┐рд░реНрднрд░рддрд╛ рдХреЗ рд▓рд┐рдП рджреЗрдЦреЛред

рдПрдХ рд╕реЗрдХрдВрдб рд╕реЗ рднреА рдХрдо рдФрд░ рдореЙрдбрд▓ рддреИрдпрд╛рд░ рд╣реИред

рдЫрд╡рд┐

рдЗрд╕реЗ рдХреИрд╕реЗ рд▓рд╛рдЧреВ рдХрд░реЗрдВ? рдЕрдм рд╣рдо рджреЗрдЦреЗрдВрдЧреЗ!

рдЪрд░рдг рдкрд╛рдБрдЪ рдирд┐рд╖реНрдХрд░реНрд╖


рдЕрдм рд╣рдореЗрдВ рдЕрдкрдиреЗ рдкрд░реАрдХреНрд╖рдг рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рддрд╛рд▓рд┐рдХрд╛ рд▓реЛрдб рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ, рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рд╣рдореЗрдВ рдПрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдмрдирд╛рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдЗрд╕ рддрд╛рд▓рд┐рдХрд╛ рдХреЗ рд╕рд╛рде, рд╣рдо рд╡рд╣реА рд╕рднреА рдХрд╛рд░реНрдп рдХрд░реЗрдВрдЧреЗ рдЬреЛ рд╣рдордиреЗ рдПрдХреНрд╕ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдерд╛ред

X_test = pd.read_csv('test.csv', index_col=0)

count = ['Name', 'Ticket', 'Cabin', 'Embarked']
X_test.drop(count, inplace=True, axis=1)

X_test = np.array(X_test)

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [1])],
                       remainder='passthrough')
X_test = np.array(ct.fit_transform(X_test))

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
imputer.fit(X_test)
X_test = imputer.transform(X_test)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_test[:, 2:] = sc.fit_transform(X_test[:, 2:])

рд╣рдо рдЕрдкрдирд╛ рдореЙрдбрд▓ рдкрд╣рд▓реЗ рд╣реА рд▓рд╛рдЧреВ рдХрд░ рджреЗрдВрдЧреЗ!

gbc_predict = gbc.predict(X_test)

рд╕рдмред рд╣рдордиреЗ рдПрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛рдпрд╛ред рдЕрдм рдЗрд╕реЗ рд╕реАрдПрд╕рд╡реА рдореЗрдВ рджрд░реНрдЬ рдХрд░рдиреЗ рдФрд░ рд╕рд╛рдЗрдЯ рдкрд░ рднреЗрдЬрдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред

np.savetxt('my_gbc_predict.csv', gbc_predict, delimiter=",", header = 'Survived')

рдХрд┐рдпрд╛ рд╣реБрдЖред рдкреНрд░рддреНрдпреЗрдХ рдпрд╛рддреНрд░реА рдХреЗ рд▓рд┐рдП рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпреЛрдВ рд╡рд╛рд▓реА рдПрдХ рдлрд╝рд╛рдЗрд▓ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВред рдпрд╣ рдЗрди рдирд┐рд░реНрдгрдпреЛрдВ рдХреЛ рд╕рд╛рдЗрдЯ рдкрд░ рдЕрдкрд▓реЛрдб рдХрд░рдиреЗ рдФрд░ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдмрдирд╛ рд╣реБрдЖ рд╣реИред рдЗрд╕ рддрд░рд╣ рдХрд╛ рдПрдХ рдЖрджрд┐рдо рд╕рдорд╛рдзрд╛рди рдЬрдирддрд╛ рдкрд░ рди рдХреЗрд╡рд▓ 74% рд╕рд╣реА рдЬрд╡рд╛рдм рджреЗрддрд╛ рд╣реИ, рдмрд▓реНрдХрд┐ рдбреЗрдЯрд╛ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЗ рд▓рд┐рдП рдХреБрдЫ рдкреНрд░реЗрд░рдгрд╛ рднреА рджреЗрддрд╛ рд╣реИред рдХрд┐рд╕реА рднреА рд╕рдордп рд╕рдмрд╕реЗ рдЙрддреНрд╕реБрдХ рдореБрдЭреЗ рдирд┐рдЬреА рд╕рдВрджреЗрд╢реЛрдВ рдореЗрдВ рд▓рд┐рдЦ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдПрдХ рдкреНрд░рд╢реНрди рдкреВрдЫ рд╕рдХрддреЗ рд╣реИрдВред рд╕рднреА рдХреЛ рдзрдиреНрдпрд╡рд╛рдж!

All Articles