Skip to content

02-数据预处理

本章讲解机器学习中的数据清洗、特征工程和数据集划分。


章节导航

章节文件主题
0101-数据预处理.md数据清洗、特征工程、数据集划分

核心知识点

数据清洗

  • 缺失值处理:删除、统计值填充
  • 异常值检测:3σ原则、IQR 方法

特征工程

  • 类别编码:标签编码、独热编码
  • 特征缩放:标准化、归一化
  • 特征选择:SelectKBest、RFE

数据集划分

  • train_test_split()
  • 交叉验证 cross_val_score()