数据科学专业详解(Data Science)
随着科技的不断更新,人们的一举一动都被记录下来,而这个记录就是数据。很多公司不怕人们产生的数据量大,它们害怕有什么东西是没有记录下来的。对这些公司来说,任何细节都有可能赚到钱。
举个例子,小伙伴在某宝上搜索了什么商品,下次刷新网页,你会看到新的商品或者类似的商品就会弹出来。网页中的视频插播的广告也是关于商品相关的。这就是网站一个重要的广告盈利模式。网站通过数据分析来预测你的偏好,这个就是数据科学中的Preictive Analytics预测分析。而预测分析也只是DS的冰山一角。
数据科学专业人才有着巨大的市场需求和人才缺口。据麦肯锡全球研究院的报告“Big ata: The next frontier for innovation, competition, an prouctivity”说,“到2019年,能够利用大数据来分析业务和经营管理的人缺口巨大,仅美国就一地就缺少约14万到19万具有深度数据分析能力的人才,150万能利用大数据分析进行决策的管理人员。而且这类人才的短缺才刚刚开始,基础设施建设的有效性、激烈竞争催生的持续创新、公共安全领域对大数据利用的渴求等等都将加大大数据分析人才缺口。
数据科学主要学习数学,统计,和一些CS的课程如算法和数据结构。Python, R ,SQL是用的最多的编程语言。这个专业应用领域非常广,从科技行业到媒体行业到甚至体育行业都有很大的需求。例如在美国最大的媒体公司NBC Universal和体育公司MLB做ata science,这些传统公司现在很需要会处理数据或者“大数据”的技术人才。过去大家觉得数据就是在Excel里随便拖拖拉拉就可以了,现在发现Excel连数据都装不下了。
现在“大数据”这个词非常火热,其实这就是数据科学一个很重要的应用领域。业界很多大公司现在会用Haoop,Spark,Hive等去做分布式计算来处理大数据问题。这两年一家做Spark平台的创业公司非常火,叫做Data bricks。很多非IT大公司现在用的就是他们的平台来处理大数据的清洗和建模。
数据科学也是美国现在最火的一个专业之一。