Comment je (PhD Neurobiologie) est devenu Data Scientist en 6 mois

Quatre outils que j'ai utilisés dans la formation sans dépenser un centime.

image Je viens de fuir huit ans d'études et de travail acharné sans plan. Vous vous demandez peut-être pourquoi les gens font de telles choses. Le fait est que pendant longtemps mon patron a repoussé mon envie de travailler et j'ai compris qu'il était temps de changer quelque chose.

Mon jeune homme m'a invité à devenir data scientist. Ma réaction, bien sûr, a été "Tu es fou!", Parce que je ne savais absolument rien de la programmation. Il a sans doute surestimé mes capacités. Ainsi, le syndrome de l'imposteur se rappelle encore une fois.

Après environ deux semaines, mon amie Anna a suggéré la même chose. Avec un peu de réflexion, j'ai sérieusement commencé à réfléchir à cette idée. Pourquoi pas? J'ai donc décidé de redevenir un débutant et de commencer une nouvelle vie en tant que data scientist.

Je voulais étudier à mon rythme, j'ai donc décidé de suivre des cours en ligne. J'ai pensé qu'avec un doctorat en neuroscience, j'avais déjà reçu une formation formelle suffisante pour travailler en science des données. J'avais juste besoin de connaissances pratiques.

Je vais parler de quatre cours différents que j'ai suivis et de la façon dont ils m'ont amené à travailler avec la science des données dans une startup de la santé dans la Silicon Valley.

La plupart des cours en ligne que j'ai trouvés étaient gratuits à l'époque. Je me suis donc lancé un défi: acquérir toutes les compétences nécessaires sans dépenser un centime. Que puis-je dire, je suis un vrai avare.

image

Compétences de base


Lorsque j'ai quitté mon doctorat à l'Université de Californie à San Francisco, je n'avais absolument aucune expérience en programmation. Dans mes recherches, j'ai utilisé des indicateurs statistiques, mais à petite échelle. Tous les ensembles de données analysés ont été créés par moi au laboratoire. Pour cette raison, le nombre d'observations était extrêmement faible. J'avais besoin d'apprendre à écrire du code et à analyser des données dans un volume beaucoup plus important.

Commencer à écrire du code


Quand j'ai décidé que je voulais devenir data scientist, j'ai d'abord voulu apprendre à écrire des programmes informatiques. Comme je n'avais jamais codé auparavant, l'ensemble du processus m'était complètement inconnu. J'ai décidé que si je déteste écrire du code, la data science n'est définitivement pas pour moi. Cela semblait être une bonne idée pour commencer.

J'ai eu de la chance car mon partenaire Ben a travaillé dans de nombreux secteurs technologiques et a pu m'orienter dans la bonne direction. Il a suggéré que Python me conviendrait le mieux. Python est idéal pour l'analyse de données, il est polyvalent et fait un excellent travail avec de grandes quantités de données. Un début a été fait.

Programmation d'apprentissage


1. Codecademy

Au début de la formation, j'ai utilisé Codecademy . J'ai commencé avec le cours «Introduction à Python», mais je ne suis pas sûr qu'il existe toujours, puisque je l'ai repassé en 2014. Si j'avais besoin de commencer à apprendre Python dès maintenant, je commencerais probablement par le cours Analyser les données avec Python .

Il me semble que Codecademy est un excellent point de départ. Le principal avantage pour moi était que je pouvais écrire du code directement dans le navigateur. C’est aussi pire pour moi d’installer correctement les logiciels sur mon ordinateur. Par conséquent, au début, c'était agréable d'éviter cela. C'était calme de penser que si mon code ne fonctionnait pas, c'était à cause d'une erreur de syntaxe , et non d'une erreur d'installation du logiciel.

J'ai aussi aimé la façon dont les cours pouvaient être donnés pendant plusieurs minutes. Je suis allé à Codecademy quand j'avais du temps libre et j'ai résolu plusieurs problèmes en attendant mon attention. Cette progression pas à pas signifiait que je n'avais pas peur des volumes et n'y étais pas coincé.

Au moment où j'ai terminé le cours, seuls quelques cours étaient proposés sur le site, et celui-ci était gratuit. J'ai été étonné de la qualité des programmes gratuits en ligne.

Une fois que j'ai appris les bases de Python, j'ai dû commencer à améliorer mes connaissances en statistiques et apprendre à analyser les données à plus grande échelle.

Analyse des données d'apprentissage


2. Spécialisation Coursera Data Science par Johns Hopkins Dans un
deuxième cours, j'ai complété la spécialisation Coursera Data Science par Johns Hopkins. À cette époque, il était possible d'obtenir gratuitement un certificat honorifique, et vous n'aviez qu'à payer pour un certificat vérifié.

Le certificat vérifié n'était pas si important pour moi. J'ai dû démontrer mes compétences lors des entretiens techniques. J'ai donc choisi la version gratuite.
Cette série de cours a été enseignée en langue R, ce qui pour moi était un inconvénient. R est un excellent langage de programmation pour l'analyse statistique et est populaire dans le monde universitaire. Cependant, pour la science des données, je voulais apprendre Python. Il m'a semblé que ce serait plus utile pour les startups où je voulais travailler.

J'ai étudié plusieurs cours sur l'analyse de données en Python, mais ils ont suggéré des compétences que je n'avais pas encore. Il me semble que la plupart de ces cours s'adressaient aux développeurs de logiciels qui souhaitaient passer à la science des données. Par conséquent, les créateurs du cours ont suggéré que vous possédiez déjà d'importantes compétences en programmation et que vous saviez déjà comment configurer votre environnement en Python.

J'ai aimé que ce cours explique tous les aspects depuis le tout début. La première leçon contenait des instructions pas à pas sur la façon d'installer R et R-Studio. Il était plus facile de suivre des cours, sachant que les problèmes techniques ne se poseraient plus.

Ce cours était également dispensé par le ministère de la Santé, ce qui me convenait parfaitement. Mon expérience en sciences médicales m'a permis de comprendre facilement les exemples donnés. Ils ont cité les effets de la qualité de l'air sur l'asthme et d'autres ensembles de données sur la santé. Par conséquent, je pourrais me concentrer sur le contenu du cours, plutôt que d'essayer de comprendre les scripts présentés pour l'analyse des données.

Cette série de cours m'a vraiment aidé à démarrer à un niveau de base de compréhension des aspects fondamentaux de la science des données. Elle a couvert la programmation R, le nettoyage des données, l'analyse, la régression et l'apprentissage automatique. J'ai vraiment aimé apprendre à coder et à utiliser le code pour analyser les données, j'ai donc été inspiré pour continuer à apprendre.

Entrevues d'information


À ce stade de ma reconversion, j'ai commencé à demander à mes amis de me présenter à San Francisco, qui est également passé du monde universitaire à la science des données. Certains ont pu m'aider, j'ai donc programmé autant d'entretiens d'information que possible.

Mon ami m'a présenté un data scientist de Modcloth avec un parcours professionnel similaire. Elle était également une neuroscientifique dont les conseils m'ont été utiles.
Sa principale recommandation était d'apprendre le SQL.

Explorer les requêtes de base de données


3. DB5 SQL Stanford Online

Au cours de Johns Hopkins sur Coursera, il n'y avait pas un mot sur SQL. Ma nouvelle connaissance a déclaré que la majeure partie de son travail quotidien consistait à rechercher dans la base de données. Elle avait besoin de récupérer des informations pour les équipes de gestion d'entreprise et de marketing. L'analyse statistique et l'apprentissage automatique ont pris très peu de temps.

J'ai suivi ses conseils et commencé un cours indépendant, " SQL course Stanford Online ". De tous les cours que j'ai suivis, celui-ci est mon préféré, car l'enseignant s'est avéré excellent et a utilisé des exemples simples pour expliquer les concepts. Elle a également utilisé plusieurs méthodes pour expliquer un concept.

Depuis lors, j'ai recommandé ce cours à tant de personnes, car je pense que chaque data scientist a besoin d'une bonne base en SQL. De nombreux cours de science des données que j'ai rencontrés ne disaient pas comment obtenir des données d'une base de données à l'aide de SQL. À mon avis, c'est une grosse erreur. Dans la plupart des cours, vous pouvez trouver un fichier CSV prêt à l'emploi pour les étudiants, mais je l'ai rarement vu directement dans mon travail.

Dès que j'ai terminé le cours SQL sur la plate-forme Stanford Online, j'ai commencé à postuler à des postes vacants en science des données. J'ai ensuite vécu en Australie et commencé à obtenir des interviews sur Skype dans des startups de la Bay Area à San Francisco. Lors des entretiens, j'ai souhaité continuer à développer mes compétences.

Concepts de fixation


4. Fondements edX de l'analyse de données

J'ai ensuite suivi le cours Fondements de l'analyse de données sur la plate-forme edX en utilisant R. Cela m'a aidé à me souvenir des concepts que j'avais déjà pris dans le cours Coursera.

Je crois fermement que diverses méthodes d'enseignement aident à absorber de nouvelles informations. Il est beaucoup plus facile de comprendre les statistiques et les concepts de l'apprentissage automatique, en les étudiant au deuxième tour. Je pense que ce cours m'a permis de mieux comprendre les sujets.

J'étais encore en train de terminer le cours quand j'ai réussi à passer un entretien chez Amino, une start-up de San Francisco, reçu un visa de travail et déménagé aux États-Unis.

Obtenir un emploi en science des données


Il me semble que l'entrevue finale a été réussie parce que j'avais non seulement des compétences décentes en écriture de code et en statistiques, mais, plus important encore, j'avais une formation en soins de santé, en conception expérimentale et en méthode scientifique.
À mon avis, ce sont ces compétences supplémentaires qui ont rendu mon CV plus significatif aux yeux des employeurs, et ils se sont aventurés à m'emmener dans une startup. J'étais un débutant qui avait besoin de plusieurs fois plus de formation. Il me semble que tous les cours suivis étaient exactement suffisants pour que le comité de sélection soit attentif à moi, mais mon expérience dans le domaine de la santé m'a vraiment distingué des autres candidats.

Par conséquent, si vous souhaitez changer de profession et passer à la science des données, je vous recommande de rechercher les entreprises où vos connaissances existantes seront appréciées.

Ce que j'aimerais apprendre


La principale lacune dans mes connaissances que je voudrais combler avant de commencer à travailler dans une nouvelle entreprise était l'utilisation de Git via la ligne de commande. Je n'avais jamais utilisé de terminal ou de ligne de commande auparavant, donc je ne savais pas comment utiliser Git pour valider mon code dans le référentiel Github de mon entreprise.

Plusieurs experts ont mis beaucoup de temps à me mettre à jour. Je voudrais au moins avoir une idée sur ce sujet pour ne pas perdre leur temps précieux. Mes collègues sont absolument incroyables et ne semblent pas du tout contre de m'aider, mais au début, je me sentais un fardeau.

En fin de compte, je me suis impliqué, le cours « Apprenez à coder la ligne de commande à la dure » m'a également beaucoup aidé .

Si vous envisagez une transition similaire vers la science des données, foncez! Pour moi, ce choix était correct. Tout le monde étudie de différentes manières, mais si vous avez de l'autodiscipline et terminez ce que vous commencez, vous avez toutes les chances d'apprendre la science des données en utilisant des cours en ligne. Je vous souhaite bonne chance et serai heureux de répondre à toutes vos questions.



image
Apprenez en détail comment obtenir un métier recherché à partir de zéro ou passer au niveau supérieur en termes de compétences et de salaire en suivant les cours en ligne SkillFactory:



Lire la suite



All Articles