融优学堂-精品慕课学习平台(北京高校优质课程研究会)

仅限机器人回答,不支持人工回复。

QQ:3827162207

工作日 8:30-17:30

需要添加好友后才可以发起提问

服务热线

010-82887279

转8059

18601339893

工作日

8:30-17:30

扫码下载手机APP

4
学分
8126人报名学习
  • 2019秋
  • 2020春
  • 2020秋
课程报名
教授
黄定江,华东师范大学数据科学与工程学院教授、博士生导师。2007年获大连理工大学计算数学博士学位,2008-2012和2015-2016年在复旦大学计算机学院、新加坡南洋理工大学计算机工程学院和美国加州大学圣克鲁兹分校计算机系从事博士后和访问研究。主要从事数据科学、机器学习与人工智能及其在计算金融、政府治理和教育等跨领域的大数据解析和应用研究等。先后主持或承担国家自然科学基金重点项目、国家重点基础发展规划“973”项目子课题等多个科研项目。以第一作者身份在国内外重要学术会议和期刊如ICLR, IJCAI, IEEE TKDE, ACM TIST, JDE等发表论文近40篇。担任20多个国际会议或期刊的程序委员或评审人。

课程介绍

在信息社会,各行各业都充满了"大数据"。数据科学与工程作为一门新兴学科,深深扎根于"大数据"这一广袤的土地上。然而,大数据的海量、高维、多模态(多样性)以及无处不在的噪声等特性,决定了对大数据的处理和分析有别于传统的纯粹的计算机科学或统计学。为了处理这些问题,需要培养学生新的数学基础,如对数据表示的高维空间的直观认识,熟悉用概率的方式思考问题,并且能够同步优化建模和设计算法,最终落地于计算机上的实现以及实际应用解决方案。这就需要对传统计算机科学以离散数学为重点的数学教学体系做重大改进,转移到以矩阵论、概率和数值优化为重点的符合数据科学与工程特色的新的数学体系,然而这一体系非常庞大,不宜分开教。因此,需要设计一门新的数据科学与工程的数学基础课程来满足这一专业的需求。 本课程主要介绍数据科学、人工智能和机器学习领域所需的核心数学基础知识,涉及矩阵计算、概率和信息论基础、优化基础。课程内容按照从模式分析到数据分析再到数学基础的思路来组织,围绕数据分析系统的核心构成:数据、模型和学习形成数据线和数学线两条线。数据线按照数据分析的处理流程、通过大量翔实的案例作为导引,引出所需数学;数学线紧扣数据线,按照知识内容发生的内在自然逻辑顺序展开。两者相辅相成,构成从具体到抽象、从抽象到具体的闭环。 课程的目的是让学生能够系统、有针对性的掌握这些数学基础知识,能够使用他们去理解和分析各类数据处理算法涉及的数学问题,为后续系统学习数据分析相关专业必修课和选修课打下基础。内容难度在工科的高等数学、线性代数和概率论与数理统计的基础上往下延展,难度适中并配有相当数量的习题。学生学完这门课后可以轻松学习数据科学与工程算法、机器学习、人工智能、计算机视觉和自然语言处理等等数据科学相关课程的学习。 本课程在数据科学的定位类似于《离散数学》在计算机科学的定位,可作为数据科学与大数据技术、人工智能、计算机科学和软件工程等相关专业的本科生或研究生的数学基础必修课程,也可作为学术和工业界科技人员了解和应用数据科学与大数据技术数学基础的选修课程或参考。

考核要求

课程安排

  • 课程介绍
    1. 1. 考评规则
  • 绪论
    1. 1. 课程介绍
    2. 2. 从图像感知到自然语言处理
    3. 3. 从数据分析到数学基础
    4. 4. 小结测验
  • 向量和矩阵基础
    1. 1. 向量与矩阵的基本概念:数据表示的观点
    2. 2. 向量和矩阵的运算
    3. 3. 向量空间和子空间
    4. 4. 线性无关性、生成集和坐标
    5. 5. 秩、仿射空间
    6. 6. 线性映射:线性模型的观点
    7. 7. 线性映射的矩阵表示
    8. 8. 线性变换
    9. 9. 仿射映射
    10. 10. 行列式
    11. 11. 迹和二次型
    12. 12. 特征值和特征向量
    13. 13. 小结测验
  • 度量与投影
    1. 1. 向量范数
    2. 2. 内积、距离、夹角与正交性
    3. 3. 数据科学中常用的相似性度量I
    4. 4. 矩阵的內积与范数
    5. 5. 范数在机器学习中的应用
    6. 6. 矩阵的四个基本子空间
    7. 7. 四个基本子空间的正交性
    8. 8. 正交投影:降维的几何视角
    9. 9. 正交基和Gram-Schmidt正交化
    10. 10. 特殊的正交变换矩阵——旋转
    11. 11. 反射矩阵
    12. 12. 信号处理中特殊的正交矩阵
    13. 13. 小结测验
  • 矩阵分解
    1. 1. 数学中常见的具有特殊结构的矩阵
    2. 2. LU分解
    3. 3. 基于Gram-Schmidt正交化的QR分解
    4. 4. 基于Householder变换的QR分解
    5. 5. 基于Givens变换的QR分解
    6. 6. 对称矩阵的谱分解
    7. 7. 正半定矩阵与Cholesky分解
    8. 8. 奇异值分解
    9. 9. 基于奇异值分解的矩阵性质
    10. 10. 奇异值和矩阵近似
    11. 11. 小结测验
  • 矩阵计算问题
    1. 1. 线性方程组问题
    2. 2. 三角形线性方程组
    3. 3. 矩阵分解解线性方程组
    4. 4. 敏度分析与其他方法
    5. 5. 最小二乘问题
    6. 6. 最小二乘问题的求解方法
    7. 7. 最小二乘问题的变体
    8. 8. 最小二乘问题的解的敏感性
    9. 9. 特征值问题
    10. 10. 幂法和反幂法
    11. 11. 特征值计算的应用
    12. 12. 小结测验
  • 向量与矩阵微分
    1. 1. 17.1 向量函数和矩阵函数
    2. 2. 17.2 统计机器学习中非概率函数模型
    3. 3. 17.3 深度学习中的函数构造
    4. 4. 18.1 向量和矩阵函数的梯度
    5. 5. 18.2 向量和矩阵函数微分与迹微分法
    6. 6. 18.3 向量值和矩阵值函数的梯度
    7. 7. 18.4 链式法则与一些有用的梯度公式
    8. 8. 18.5 反向传播与自动微分
    9. 9. 18.6 高阶导数与泰勒展开
  • 概率基础
    1. 1. 19 概率论基本概念
    2. 2. 20 随机变量
    3. 3. 21 随机变量及其数字特征:数据度量的观点II
    4. 4. 22.1 概率不等式
    5. 5. 22.2 随机变量的收敛
    6. 6. 22.3 随机过程
  • 信息论基础
    1. 1. 自信息和互信息
    2. 2. 熵函数的性质
    3. 3. 联合熵和条件熵
    4. 4. 数据处理定理
    5. 5. 连续信源的微分熵和最大熵
    6. 6. 信息论在数据科学中的应用
  • 概率模型和参数估计
    1. 1. 模型、统计推断与学习
    2. 2. 概率密度估计简介
    3. 3. 基于频率观点的参数估计
    4. 4. 贝叶斯推断
    5. 5. 统计决策与贝叶斯估计
    6. 6. 非参数估计
    7. 7. 概率模型有向图表示
    8. 8. 概率模型无向图表示
    9. 9. 机器学习中的概率建模思路
    10. 10. 机器学习中的概率模型
    11. 11. 深度学习中的概率模型
    12. 12. 强化学习中的概率模型
  • 优化基础
    1. 1. 优化问题的一般形式
    2. 2. 优化问题的分类
    3. 3. 常见的优化问题
    4. 4. 凸集
    5. 5. 凸函数
    6. 6. 共轭函数
    7. 7. 次梯度
    8. 8. 凸优化
    9. 9. 典型凸优化问题
  • 最优性条件和对偶理论
    1. 1. 无约束优化最优性条件
    2. 2. 拉格朗日对偶函数
    3. 3. 拉格朗日对偶问题
    4. 4. slate约束条件和强对偶
    5. 5. KKT 最优性条件
    6. 6. 对偶在数据科学优化中的应用
  • 优化算法
    1. 1. 无约束优化算法概述
    2. 2. 精确和非精确线搜索方法
    3. 3. 一阶方法
    4. 4. 二阶方法
    5. 5. 可行方向法
    6. 6. 制约函数法
    7. 7. 随机梯度下降
    8. 8. 动量梯度下降
    9. 9. 自适应学习
  • 期末考试
    1. 1. 课程评价
    2. 2. 期末测试
    3. 3. 期末考试

课程资料

  • Lec1.pdf
  • Lec2.pdf
  • Lec3.pdf
  • Lec4.pdf
  • Lec5.pdf
  • Lec6.1.pdf
  • Lec6.pdf
  • Lec7.pdf
  • Lec9.pdf
  • Lec11.pdf
  • Lec10.pdf
  • Lec12.pdf
  • Lec13.pdf
  • Lec14.pdf
  • 14.2.mp4
  • 14.1.mp4
  • 14.3.mp4
  • 14.2.mp4
  • 14.1.mp4
  • Lec15.pdf
  • Lec16.pdf
  • Lec8.pdf
  • Lec18.pdf
  • Lec19.pdf
  • Lec21.pdf
  • Lec22.pdf
  • Lec20.pdf
  • Lec17.pdf
  • Lec23.pdf
  • Lec25.pdf
  • Lec27.pdf
  • Lec24.pdf
  • Lec26.pdf
  • Lec31.pdf
  • Lec28.pdf
  • Lec30.pdf
  • Lec32.pdf
  • Lec29.pdf
  • Lec23 - 信息论.pdf
  • 22.1 概率不等式.mp4
  • 22.2 随机变量的收敛.mp4
  • Lec33-chap12.pdf
  • Lec34.pdf
  • Lec36.pdf
  • Lec35.pdf

讨论(154)

  • 汪小曼

    10-22
    课程非常好
  • 22春_汤越

    01-26
    课程非常好
  • 21秋_傅也轩

    01-12
    课程非常好
  • 21秋_刘静

    01-08
    课程非常好