Cómo (PhD Neurobiology) me convertí en Data Scientist en 6 meses

Cuatro herramientas que utilicé en el entrenamiento sin gastar un centavo.

imagen Me escapé de ocho años de estudio y trabajo duro sin un plan. Tal vez se pregunte por qué la gente hace tales cosas. El hecho es que durante mucho tiempo mi jefe luchó contra mi deseo de trabajar, y entendí que era hora de cambiar algo.

Mi joven me invitó a ser científico de datos. Mi reacción, por supuesto, fue "¡Estás loco!", Porque no sabía absolutamente nada sobre programación. Sin duda él sobreestimó mis habilidades. Entonces el síndrome del impostor nuevamente se recuerda a sí mismo.

Después de aproximadamente dos semanas, mi amiga Anna sugirió lo mismo. Con un poco de pensamiento, comencé a pensar seriamente en esta idea. Por qué no? Así que decidí volver a ser novato y comenzar una nueva vida como científico de datos.

Quería estudiar a mi propio ritmo, así que decidí tomar cursos en línea. Pensé que con un doctorado en neurociencia ya tenía suficiente capacitación formal para trabajar en ciencia de datos. Solo necesitaba conocimiento práctico.

Hablaré sobre cuatro cursos diferentes que tomé y cómo me llevaron a trabajar con la ciencia de datos en una startup de salud en Silicon Valley.

La mayoría de los cursos en línea que encontré eran gratuitos en ese momento. Así que me desafié a mí mismo: obtener todas las habilidades necesarias sin gastar un centavo. ¿Qué puedo decir? Soy un verdadero avaro.

imagen

Habilidades básicas


Cuando dejé mi doctorado por primera vez en la Universidad de California en San Francisco, no tenía absolutamente ninguna experiencia en programación. En mi investigación, utilicé indicadores estadísticos, pero a pequeña escala. Todos los conjuntos de datos analizados fueron creados por mí en el laboratorio. Por esta razón, el número de observaciones fue extremadamente pequeño. Necesitaba aprender a escribir código y analizar datos en un volumen mucho mayor.

Comenzar a escribir código


Cuando decidí que quería convertirme en científico de datos, en primer lugar, quería aprender a escribir programas de computadora. Como nunca antes lo había codificado, todo el proceso era completamente desconocido para mí. Decidí que si odio escribir código, entonces la ciencia de datos definitivamente no es para mí. Parecía una buena idea para empezar.

Tuve suerte porque mi socio Ben trabajó en muchos sectores tecnológicos y pudo orientarme en la dirección correcta. Sugirió que Python me vendría mejor. Python es ideal para el análisis de datos, es versátil y hace un gran trabajo con grandes cantidades de datos. Un comienzo ha sido hecho.

Programación de aprendizaje


1. Codecademy

Al comienzo del entrenamiento, usé Codecademy . Comencé con el curso "Introducción a Python", pero no estoy seguro de que todavía exista, ya que lo aprobé en 2014. Si tuviera que comenzar a aprender Python ahora, probablemente comenzaría con el curso Analizar datos con Python .

Me parece que Codecademy es un gran punto de partida. La principal ventaja para mí fue que podía escribir código directamente en el navegador. También es peor para mí instalar correctamente el software en mi computadora. Por lo tanto, al principio fue agradable evitar esto. Estaba tranquilo de la idea de que si mi código no funcionaba, se debía a un error de sintaxis y no a un error al instalar el software.

También me gustó cómo se podían dar clases durante varios minutos. Fui a Codecademy cuando tenía tiempo libre y resolví varios problemas esperando mi atención. Este progreso paso a paso significaba que no tenía miedo a los volúmenes y no estaba atrapado en ellos.

Cuando terminé el curso, solo se ofrecían unos pocos cursos en el sitio, y este era gratuito. Me sorprendió la calidad de los programas gratuitos en línea.

Una vez que aprendí los conceptos básicos de Python, necesitaba comenzar a mejorar mi conocimiento de las estadísticas y aprender a analizar datos a mayor escala.

Análisis de datos de aprendizaje


2. Especialización en ciencia de datos de Coursera por Johns Hopkins Como
segundo curso, completé la Especialización en ciencia de datos de Coursera por Johns Hopkins. En ese momento, era posible obtener un certificado honorario de forma gratuita, y solo tenía que pagar por un certificado verificado.

El certificado verificado no era tan importante para mí. Tuve que demostrar habilidades de los cursos durante las entrevistas técnicas. Por lo tanto, elegí la versión gratuita.
Esta serie de cursos se impartió en el lenguaje R, lo que para mí fue un inconveniente. R es un excelente lenguaje de programación para el análisis estadístico y es popular en la academia. Sin embargo, para la ciencia de datos, quería aprender Python. Me pareció que sería más útil para las startups donde quería trabajar.

Investigué varios cursos sobre análisis de datos en Python, pero me sugirieron habilidades que aún no tenía. Me parece que la mayoría de estos cursos estaban dirigidos a desarrolladores de software que querían pasar a la ciencia de datos. Por lo tanto, los creadores del curso sugirieron que ya tiene habilidades de programación significativas y que ya sabe cómo configurar su entorno en Python.

Me gustó que este curso explicara todos los aspectos desde el principio. La primera lección tenía instrucciones paso a paso sobre cómo instalar R y R-Studio. Era más fácil tomar más cursos, sabiendo que ya no surgirían problemas técnicos.

Este curso también fue impartido por el Departamento de Salud, lo cual fue muy adecuado para mí. Mi experiencia en las ciencias médicas me facilitó la comprensión de los ejemplos dados. Citaron los efectos de la calidad del aire sobre el asma y otros conjuntos de datos de salud. Por lo tanto, podría centrarme en el contenido del curso, en lugar de tratar de comprender los scripts presentados para el análisis de datos.

Esta serie de cursos realmente me ayudó a comenzar a un nivel básico de comprensión de los aspectos básicos de la ciencia de datos. Cubrió la programación R, la limpieza de datos, el análisis, la regresión y el aprendizaje automático. Realmente disfruté aprendiendo a codificar y usar código para analizar datos, así que me inspiró para continuar aprendiendo.

Entrevistas informativas


En esta etapa de mi reentrenamiento, comencé a pedirles a mis amigos que me presentaran a personas en San Francisco, que también pasaron de la academia a la ciencia de datos. Algunos pudieron ayudarme, así que programé tantas entrevistas informativas como pude.

Mi amigo me presentó a un científico de datos de Modcloth con una carrera profesional similar. Ella también era una neurocientífica cuyo consejo me fue útil.
Su principal recomendación fue aprender SQL.

Explorando consultas de bases de datos


3. DB5 SQL Stanford Online

En el curso de Johns Hopkins en Coursera no hubo una sola palabra sobre SQL. Mi nuevo conocido dijo que la mayor parte de su trabajo diario consistía en buscar en la base de datos. Necesitaba recuperar información para los equipos de gestión empresarial y marketing. El análisis estadístico y el aprendizaje automático tomaron muy poco tiempo.

Seguí su consejo y comencé un curso independiente, " Curso SQL Stanford Online ". De todos los cursos que tomé, este es mi favorito, porque el maestro resultó excelente y usó ejemplos simples para explicar conceptos. También usó varios métodos para explicar un concepto.

Desde entonces, he recomendado este curso a muchos, porque creo que cada científico de datos necesita una buena base en SQL. Muchos cursos de ciencia de datos que encontré no decían cómo obtener datos de una base de datos usando SQL. En mi opinión, este es un gran error. En la mayoría de los cursos, puede encontrar un archivo CSV listo para usar para los estudiantes, pero rara vez lo vi directamente en mi trabajo.

Tan pronto como terminé el curso de SQL en la plataforma Stanford Online, comencé a solicitar vacantes en ciencia de datos. Luego viví en Australia y comencé a recibir entrevistas por Skype en startups en el Área de la Bahía en San Francisco. Durante las entrevistas, quería seguir desarrollando mis habilidades.

Conceptos de fijación


4. Fundamentos de análisis de datos edX

Luego tomé el curso de análisis de fundamentos de datos en la plataforma edX usando R. Me ayudó a recordar los conceptos que ya tomé en el curso Coursera.

Creo firmemente que varios métodos de enseñanza ayudan a absorber nueva información. Es mucho más fácil comprender las estadísticas y los conceptos del aprendizaje automático, estudiándolos en la segunda ronda. Creo que este curso me ha dado una comprensión más profunda de los temas.

Todavía estaba terminando el curso cuando pasé con éxito una entrevista en Amino, una empresa de atención médica en San Francisco, recibí una visa de trabajo y me mudé a los Estados Unidos.

Conseguir un trabajo en ciencia de datos


Me parece que la entrevista final fue exitosa porque no solo tenía buenas habilidades para escribir códigos y estadísticas, sino que, lo que es más importante, tenía experiencia en atención médica, diseño experimental y el método científico.
En mi opinión, fueron estas competencias adicionales las que hicieron que mi currículum vitae fuera más significativo a los ojos de los empleadores, y se aventuraron a llevarme a una startup. Yo era un novato que necesitaba varias veces más entrenamiento. Me parece que todos los cursos tomados fueron exactamente suficientes para que el comité de selección me prestara atención, pero mi experiencia en el campo de la salud realmente me distinguió de otros candidatos.

Por lo tanto, si desea cambiar su profesión y pasar a la ciencia de datos, le recomendaría buscar aquellas empresas en las que apreciará su conocimiento actual.

Lo que me gustaria aprender


El principal vacío en mi conocimiento que me gustaría llenar antes de comenzar a trabajar en una nueva empresa fue el uso de Git a través de la línea de comando. Nunca antes había usado una terminal o línea de comando, así que no tenía idea de cómo usar Git para confirmar mi código en el repositorio Github de mi empresa.

Varios expertos tardaron mucho en ponerme al día. Al menos me gustaría tener una idea sobre este tema para no perder su valioso tiempo. Mis colegas son absolutamente increíbles y aparentemente no están en contra de ayudarme, pero en los primeros días sentí una carga.

Al final, me involucré, el curso " Aprender a codificar la línea de comando de la manera difícil " también me ayudó mucho .

Si está considerando una transición similar a la ciencia de datos, ¡adelante! Para mí, esta elección fue correcta. Todos estudian de diferentes maneras, pero si tiene autodisciplina y termina lo que comienza, tiene todas las oportunidades de aprender ciencia de datos mediante cursos en línea. Le deseo buena suerte y estaremos encantados de responder cualquier pregunta.



imagen
Aprenda los detalles de cómo obtener una profesión solicitada desde cero o subir de nivel en habilidades y salario tomando los cursos en línea de SkillFactory:



Lee mas



All Articles