我(博士神经生物学)如何在6个月内成为数据科学家

我花了不到一分钱在训练中使用的四个工具。

图片我只是没有计划就摆脱了八年的学习和努力工作。您可能想知道为什么人们会这样做。事实是,很长一段时间以来,我的老板都抵制了我的工作愿望,而我知道现在该改变一些东西了。

我的年轻人邀请我成为一名数据科学家。我的反应当然是“你疯了!”,因为我对编程一无所知。毫无疑问,他高估了我的能力。因此,冒名顶替综合症再次使人想起。

大约两周后,我的朋友安娜建议了同样的事情。稍加思考,我便开始认真考虑这个想法。为什么不?因此,我决定再次成为新手,并以数据科学家的身份开始新的生活。

我想按自己的进度学习,所以决定参加在线课程。我认为拥有神经科学博士学位的我已经获得了足够的正规培训,可以从事数据科学工作。我只需要实践知识。

我将讨论我参加的四门不同课程,以及它们如何引导我在硅谷的一家医疗保健初创公司中从事数据科学工作。

我发现当时的大多数在线课程都是免费的。因此,我向自己发起挑战-在不花一分钱的情况下获得所有必要的技能。我能说什么,我是一个真正的失败者。

图片

基本技能


当我第一次离开加州大学旧金山分校的博士学位时,我绝对没有编程经验。在我的研究中,我使用了统计指标,但是规模很小。所有分析的数据集都是由我在实验室中创建的。因此,观察次数非常少。我需要学习如何编写代码并分析大量数据。

开始编写代码


当我决定要成为一名数据科学家时,首先我想学习如何编写计算机程序。由于我以前从未编码,因此整个过程对我来说是完全未知的。我决定,如果我讨厌编写代码,那么数据科学绝对不适合我。首先,这似乎是一个好主意。

我很幸运,因为我的合伙人Ben在许多技术领域工作过,能够为我指明正确的方向。他建议Python最适合我。Python是数据分析的理想选择,它用途广泛,并且可以处理大量数据。已经开始。

学习编程


1. Codecademy

在培训开始时,我使用了Codecademy。我从“ Python入门”课程开始,但是我不确定它是否仍然存在,因为我在2014年通过了它。如果我现在需要开始学习Python,那么我可能会从使用Python分析数据课程开始

在我看来,Codecademy是一个很好的起点。对我来说,主要优点是我可以直接在浏览器中编写代码。在计算机上正确安装软件对我来说也更糟。因此,一开始最好避免这种情况。想到如果我的代码不起作用,那是很平静的,这是因为语法错误,而不是安装软件时出现错误

我还喜欢几分钟如何上课。我有空的时候去了Codecademy,解决了一些等待我注意的问题。这种循序渐进的进展意味着我不惧怕数量,也没有陷入困境。

当我完成课程时,该站点上只提供了几门课程,而这是免费的。我对免费在线程序的质量感到惊讶。

学习了Python的基础知识之后,我需要开始提高我的统计知识,并学习如何更大规模地分析数据。

学习数据分析


2. Johns Hopkins的Coursera数据科学专业作为
第二门课程,我完成了Johns Hopkins Coursera数据科学专业。那时,可以免费获得名誉证书,而您只需要支付经过验证的证书即可。

经验证的证书对我而言并不那么重要。我必须在技术面试中展示这些课程的技能。因此,我选择了免费版本。
这一系列的课程是用R语言讲授的,这对我来说是一个缺点。 R是用于统计分析的出色编程语言,在学术界很流行。但是,对于数据科学,我想学习Python。在我看来,这对于我想工作的初创公司会更有用。

我研究了几门有关使用Python进行数据分析的课程,但是它们提出了我还没有的技能。在我看来,这些课程大多数都是针对想要转向数据科学的软件开发人员的。因此,本课程的创建者建议您已经具有重要的编程技能,并且您已经知道如何在Python中设置环境。

我喜欢这门课程从一开始就解释了所有方面。第一节课逐步指导了如何安装R和R-Studio。知道不再会出现技术问题,上更多的课程会更容易。

卫生署也教授了这门课程,非常适合我。我在医学领域的经验使我很容易理解给出的示例。他们列举了空气质量对哮喘和其他健康数据集的影响。因此,我可以专注于课程的内容,而不是试图理解为数据分析而呈现的脚本。

这一系列课程确实帮助我从一个基础水平开始,了解数据科学的基本方面。她介绍了R编程,数据清理,分析,回归和机器学习。我真的很喜欢学习编码并使用代码来分析数据,因此受到启发,我继续学习。

信息采访


在再培训的这个阶段,我开始要求我的朋友向我介绍旧金山的人们,他们也从学术界转向了数据科学。有些人可以帮助我,所以我安排了尽可能多的信息采访。

我的朋友向我介绍了Modcloth的数据科学家,他的职业生涯与此类似。她还是一位神经科学家,他的建议对我很方便。
她的主要建议是学习SQL。

探索数据库查询


3. DB5 SQL Stanford Online

在Coursera上的Johns Hopkins的过程中,对SQL一无所知。我的新朋友说她的大部分日常工作都包括搜索数据库。她需要为业务管理和营销团队检索信息。统计分析和机器学习花费的时间很少。

我听取了她的建议,并开设了独立课程“ SQL斯坦福大学在线课程 ”。在我参加的所有课程中,这是我最喜欢的课程,因为事实证明,老师非常出色,并使用简单的示例来解释概念。她还使用几种方法来解释一个概念。

从那时起,我就向很多人推荐了这门课程,因为我相信每个数据科学家都需要SQL的良好基础。我遇到的许多数据科学课程都没有讲述如何使用SQL从数据库中获取数据。我认为这是一个大错误。在大多数课程中,您可以为学生找到现成的CSV文件,但是我很少直接在我的工作中看到它。

在斯坦福在线平台上完成SQL课程后,我就开始申请数据科学职位空缺。然后我住在澳大利亚,开始在旧金山湾区的初创公司接受Skype的采访。在面试中,我想继续发展自己的技能。

固定概念


4.数据分析的edX基础

然后,我使用R在edX平台上参加了数据分析基础课程。它帮助我记住了我在Coursera课程中学过的概念。

我坚信各种教学方法有助于吸收新信息。在第二轮研究中,更容易理解机器学习的统计数据和概念。我认为本课程使我对主题有了更深刻的理解。

当我成功通过旧金山一家医疗保健初创公司Amino的面试并获得工作签证并移居美国时,我仍在完成课程。

从事数据科学工作


在我看来,最终面试是成功的,因为我不仅拥有不错的代码编写技能和统计数据,而且更重要的是,我拥有医疗保健,实验设计和科学方法方面的背景。
在我看来,正是这些额外的能力使我的简历在雇主眼中变得更有意义,他们冒险将我带到一家初创公司。我是一个新手,需要多次培训。在我看来,所采取的所有课程都足以使committee选委员会关注我,但是我在医疗保健领域的经验确实使我与其他候选人脱颖而出。

因此,如果您想改变自己的职业并转向数据科学,我建议您寻找那些会赞赏您现有知识的公司。

我想学什么


在开始在一家新公司工作之前,我想填补的主要知识差距是通过命令行使用Git。我以前从未使用过终端或命令行,因此我不知道如何使用Git将代码提交到公司的Github存储库。

几位专家花了很长时间使我了解最新情况。我至少想对此主题有所了解,以免浪费他们的宝贵时间。我的同事们绝对很棒,似乎一点也不反对帮助我,但是在初期,我感到很累。

最后,我参与进来,“ 以困难的方式学习代码命令行课程也对我有很大帮助

如果您正在考虑向数据科学的类似过渡,那就去吧!对我来说,这种选择是正确的。每个人的学习方式都不同,但是如果您有自律性并完成了开始的学习,则将有机会使用在线课程学习数据科学。祝您好运,并乐意回答任何问题。



图片
通过参加SkillFactory在线课程,了解如何从头开始获得热门职业或技能和薪资水平提高的详细信息:



阅读更多



All Articles