数据科学(Data Science)专业详解
进入大数据时代,人们对数据的关注达到了前所未有的程度。在前几年,大多数出国留学的工科生会选择计算机科学之类的专业。但最近两年,数据科学(Data Science)就跻身成为竞争最激烈的热门专业。
什么是数据科学?
我们所处的互联网时代正在产生大量数据,人类或人类群体无法以足够快的速度处理这些数据。这种数据泛滥有可能改变商业,政府,科学和医疗保健的方式。为了解决处理“数据潮”的需要,从而出现了一门新学科,这个新兴学科,我们称之为“数据科学”。
可以说,数据科学就是从数据中提取信息知识,即是数据挖掘与预测分析的延伸,亦是发掘知识与数据的过程。所以,通俗来讲,数据科学,就是通过分析数据,来挖掘获得这些数据中的潜在信息。
数据科学是一项交叉学科主要由三大块知识内容构成,它们分别是:统计学与机器学习,计算机科学与软件开发,以及相关行业的商业知识。其主要研究内容包括:数据科学基础理论、数据预处理、数据计算和数据管理。
数据科学学什么?
数据科学,Data science,在国外大学开设的专业中,其实还有其他几个类似的称呼,比如:Data Mining、Data Analytics、Data Stuies、Data Science an Management、Preictive Analytics,以及Business Intelligence an Data Analytics 等等。当然,不同的称呼,所对应的课程侧重点也会有所不同。
根据对于一些数据科学项目的课程整合,数据科学的课程主要包括三个方面:模型和算法,数据结构,以及可视化。核心的课程包括:数据科学导论,数据挖掘,高级大数据系统,大数据机器学习和数据可视化等。
数据科学很重要的一个能力就是如何通过数据来解决问题其实,其实,只要你有数学基础,会用Python或Java等任意一种编程语言,而且,对某个行业了如指掌,完全有机会成为数据科学家。
数据科学就业前景?
数据科学,可以说是当下最赚钱的行业之一,2016年和2017年的全美最佳岗位排行中,“数据科学家”已经连续两年名列前茅。根据Glassoor美国平均薪资数据显示,数据科学家的年薪中位数达到$118,709,位于榜首。
此外,IBM的一项调查预计,到2020年,市场对于数据科学家和数据工程师的需求还将增加30%,届时,每年开放的岗位将达到272万个。毫不夸张地说,数据科学家会是未来50年最火爆的职业之一。
目前,国内对数据科学家的需求一直都在持续增长,人才缺口很大。企业也会比较青睐那些有留学背景的专业人才。数据科学本身也注重实践,如果还有相关的实习经历,对将来就业也会有非常大的帮助。
数据科学申请条件?
不论是国内还是美国本土,本科就开设数据科学专业的学校并不多,因此,大部分学生申请数据科学专业都会是转专业申请。通常来说,本科背景为数学、统计学、管理、计算机和市场营销等专业的学生会更有优势。
跨专业申请申请数据科学专业,需要修过相关课程,包括:拥有完整的数学背景(微积分,线性代数,概率论,统计学,数学建模),以及计算机背景知识(计算机导论,SQL,Database,Programming)。
除此以外,还需要具备一定对于市场、行业和产品的分析能力,解决问题的能力和与人沟通的能力,如果有相关实践会是加分项,如果没有,建议文书里要提供一些经历,以体现自己的背景和基础可以胜任这个专业。并且,建议考出理想的GRE,因为大部分项目只接受GRE。
数据科学院校推荐
哥伦比亚大学
Master of Science in Data Science
哥伦比亚大学专门开设了数据科学研究所,Data Science Institute,可见哥大对于这一专业的重视。哥大的数据科学研究所拥有250多名从事各种研究的教师,致力于推进收集和解释数据的技术,并解决社会面临的问题。
哥大的数据科学硕士课程让学生通过专业的学习,从而能将数据科学技术应用于他们感兴趣的领域。哥大的数据科学提供四门基础课程,学生有机会进行基础和深入研究,包括在顶尖项目中,并有机会与学校的行业合作伙伴和行业大牛进行互动。
学生还可以选择专注于创业的选修课程或在学校的七个中心其中之一的领域进行深入研究。学校有世界顶尖的大数据科学与工程研究室,还与业界密切合作,将有前途的创意推向市场。学生可以在此参与各种实验与科研项目。
MS in computational Data Science
提起CS相关专业,不得不提的就是卡内基梅隆大学。而CMU的数据科学专业同样走在了行业前列,该项目开设于2004年,在计划中,学生将深入研究数据库,分布式算法和存储,机器学习,语言技术,软件工程,以及人机交互设计等主题。
必修的核心课程包括:云计算,机器学习,交互式数据科学和数据科学研讨会,通过核心课程和选修课程的学习,学生将形成对大型信息系统的熟练掌握,而CMU提供的实习和研究项目将确保学生拥有在职业生涯中取得成功所需的知识和经验。
CMU的数据科学项目吸引了学校顶尖的计算机科学学院的教职员工,包括计算机科学系,机器学习系和人机交互学院。该专业的很多毕业生,已经成为亚马逊,苹果,谷歌和雅虎等公司的数据科学家和项目经理。
加州大学伯克利分校
MS in Information an Data Science
伯克利的信息与数据科学硕士,同样走在了行业的最前沿。该项目旨在帮助学生掌握大规模处理数据所需要的独特的技能和工具,并且通过各种实践和研究,使之能够成为精通数据的专业人士和管理人员。
伯克利的这个项目以其学科广度而著称,与仅关注高等数学和建模的课程不同,该课程为学生提供社会科学和政策研究以及统计学,计算机科学和工程学的见解。所需的核心课程侧重于:提出好的研究或商业问题,以大规模处理数据集的方式传达结果,注重信息可视化; 以及需要深入了解信息隐私和安全的法律和道德层面 。
伯克利的课程设计独特,除了提供所需的知识和关系,还结合了在线教育,强调教师和同学的互动。每周一次的在线课程,让教师制作清晰的讲课解题视频,以便为学生在每周实时课程中进行更丰富的讨论。此外,还提供密集的职业服务和面试机会,以及与伯克利专家的面对面的研讨会和小型课程。
南加州大学
MS in Computer Science with specialization in Data Science
南加大的数据科学项目是其计算机科学硕士的一个方向,属于学校的工程学院旗下。学校及其研究中心在相关领域取得过成绩,包括:域名系统和TCP / IP协议,DNA计算的发明,以及与大脑,机器和数学相关的历史性跨学科研究。
南加大在计算机科学和跨学科领域都有深刻而多样的研究,学校为学生提供计算机科学的核心背景下的数据科学专业的学习。学生将掌握统计和系统等专业知识,用于对数据的获取,存储,访问,分析和可视化。
南加大还注重数据与各种实际相关的大型,异构和实时问题的结合,以及在实际领域的运用,包括能源,环境,健康,媒体,医药和运输。此外,学生可以充分利用学校提供的丰富的资源和多元的实践机会。
New York University 纽约大学
MS in Data Science
纽约大学的数据科学专业隶属于纽约大学克朗数学研究所,在2013年第一次招生。美国顶级的数据科学的项目本身数量不多,NYU借助学校数学优势以及强大的师资力量,在数据科学项目里名列前茅。
NYU的克朗数学研究所名声显赫,其应用数学研究全美第一,拥有18位美国国家科学院成员,超过美国的任何其他数学系。因此,NYU的数据科学项目的竞争也是非常激烈的。甚至,坊间还有传说,“能进哥大Data的,却只能进NYU Data的waitlist。”
NYU的数据科学项目作为学校的高度重视的项目之一,学校单独给分配了一栋楼的6、7层做教学和研究。师资很强,很多都是数学界的大拿,在全美学术界都赫赫有名。NYU的数据科学项目是具有高度选择性的项目,面向具有数学,计算机科学和应用统计学背景的学生,课程侧重于开发数据科学的新方法。
MS in Data Science
弗吉尼亚大学的数据科学硕士项目,通过为期11个月的专业课程,用跨学科方法帮助学生掌握走在数据科学的前沿领域所需具备的知识。并且,会将课堂作业与其在行业,学术和政府等领域的合作伙伴的项目相结合。
弗吉尼亚的数据科学研究与类似的数据科学课程不同,其重点是协作,是基于项目的学习。学生在参与到实践项目的过程中,教师和行业以及政府代表会在解决实际问题的过程中给予学生大量的指导。
MS in Statistics-Data Science
威斯康星大学麦迪逊分校的统计科学硕士 - 数据科学方向以培养专业人才为理念,使毕业生能够相关领域中独当一面。这个为期12个月的课程是在秋季和春季学期开设的,而夏季学生还有机会参与到大型企业的实习。
学生将主要学习理解上下文中的数据,汇总和可视化数据以引出见解,使用模型分析,进一步掌握统计学和数学的理论,通过复杂的数据分析获得计算专业知识,以及解释并传达数据分析。
利用统计思维的力量,学生将掌握把数据的意义传达给他人的方法,并将在现实的问题中建立分析,并提高推理和沟通技巧。因此,该项目将提供在专业人士和业务团队中工作的强大技能,以及基于数据推理的主要讨论。