4个问题揭示了您是否有最热门的工作技能2014年
虽然经济正在增长,但我们仍然在巨大经济衰退之后遭受痛苦,许多雄心勃勃的工人渴望获得最高工资的技能培训。为了查看哪些技能是最高需求的,LinkedIn的工程师挖掘了他们的大规模数据集和转移。他们发现,上面一体的一项技能具有最高的成功相关性:“统计分析和数据挖掘。”换句话说,数据科学家在市场上有最热门的技能。
实际上,数据科学家如此追捧,后者是白宫介绍鼓励大学和技术教育初创公司升级其现有课程以满足未满足的需求。
以下是一些问题,以了解您是否具有数据科学家所需的一些基本知识。这些问题是从统计课程,技术公司面试问题的课程和一些编程基础。4中的两个有一个正确/错误的答案。我们最后向您展示这些答案。
测验
1.假设你去了墨西哥的洞穴,并且已经收缩了一种罕见的疾病。你去看医生,他告诉你这种疾病的测试是正确的99%的时间,但由于它是如此罕见,它只在10,000次中随机随机发生。
你的测试回来了积极。你有这种疾病的机会是什么?
a)99%b)90%c)10%d)1%
2.你能评估这个代码吗?
Answer <- "Data science is #"
fact <- sd(-1:1)
lapply(Answer, paste, fact)
3.这是每个Facebook用户年龄和朋友数量的人造图。如果您有此数据,您是否可以重绘图表,以便只有每个年龄的平均朋友计数都显示为行图?
4.您有A / B实验的结果。您申请了一些治疗X并希望测量转换率Y.如何控制混淆变量Z?调整Z后计算p(y / x)。
答案:
1)它最接近1%。困扰乳腺癌研究领域的这个问题的关键是考虑到误报的数量。因为它如此罕见,所以会有比正确的诊断更有误报。这个问题是由教育启动,Udacity提供的。
2)代码相当于:“数据科学是#1”。这些是流行的编程语言中的3行,R。
3)这不是是或否的答案,但该过程将涉及按年龄按年龄分组数据中的每一行并计算平均值,然后重新注册。该图是从Udacity数据科学课程中的一个先进课程中获取的。
4)根据工资数据启动,GlassDoor,这是Facebook数据科学家职位的实际面试问题。论坛上最受欢迎的答案是“SUM P(y / x,z)* p(z)”。要将问题翻译成英文,一个“混淆变量”只是让它似乎是y导致x的东西,当真的没有。
因此,例如,如果谋杀率和冰淇淋销量之间存在相关性,那么销售冰淇淋就不是激烈的横冲直撞。它可以成为温暖的天气导致两者。为了回答这个问题,受访者还可以说他们将在常见的统计程序中“控制”在称为“回归”中的z变量。我不认为数据科学家必然必须知道如何做数学证明。
在我成为一名记者之前,我很幸运能受到统计分析的培训。但是,只有几年前我学习的许多技术都随着新的数据集和软件来到市场。我一直在寻找一些来自在线提供商的统计课程,包括Udacity和Coursera。
到目前为止,我是他们在线数据科学课程的粉丝,我认为它们非常可比(以某种方式更好地)到大学学位。完成课程后,毕业生将有技能做基本数据科学。来自在线教育提供者的数据科学轨道的速度约为500美元,大约需要六个星期。对于更多密集型的东西,从镀锌的Zipfian学院的12周,邮政营地“的”训练营“占16,000美元。
鉴于要做的金额,这不是糟糕的投资,可以做所有可用的选择。