课程代码:

ES2045

水平:

IM -入门/中间

类大小限制:

15

通常提供:

在的场合

关于数据科学到底是什么,人们还没有达成多少共识. 一些人认为这是一个新兴的跨学科领域,包含了计算机科学的元素, 应用统计学, 和数据可视化. 其他人则坚持认为这是科学的“第四范式”:经验主义, 理论, 计算, 现在“数据驱动”. 不管它是什么, 最重要的可能是理解数据科学是做什么的,以及你可以学会用它做什么!

本课程将广泛概述数据科学如何在“现实世界”中完成,并特别侧重于学习实际数据科学技能的应用. 对于那些对数据科学作为主要关注领域的入门探索感兴趣的人,以及那些希望在已有的工作和兴趣中增加数据技术专业知识的人来说,这将是一门很棒的课程. We’ll be focusing on four major areas of application: (1) properly building data-driven questions and hypotheses; (2) obtaining, 组织, and transforming data; (3) exploratory data analysis and pattern recognition; and, 在时间允许的情况下, (4)数据可视化与通信. 离开这个班, 学生将能够立即将这些概念应用到广泛的兴趣领域. 例如:学生应该能够从不同的数据源(如ACM的分钟数)生成假设。, 从网站(如访问美国)获取和转换数据.S. 人口普查局API), 探索和分析数据以发现模式(例如通过空间生物数据集), 并将这些数据可视化,便于与同行和外行人进行沟通.

课程将以现场编码练习、讲座和小组讨论的形式进行. 不需要之前的编程经验-我们将在本课程中学习使用R编程语言! -但熟悉计算机和数据将有所帮助. 学生将需要使用他们的个人笔记本电脑或COA借阅笔记本电脑进行课程和编程练习. 评估将通过课堂参与和讨论进行, 几个数据调查练习, 最后一个项目. 数据调查将采用几个知名数据集的书面分析,以及专门为本课程创建的合成数据集的调查. 期末专题将采取口头报告分析的形式. 这可以以小组或个人的形式进行,也可以是任何对相关学生有足够兴趣的主题.

水平:介绍/中间. 先决条件:没有. 类限制:15. 实验室费用:没有.

先决条件:

没有一个.

总访问 注册处 官方课程目录和时间表.