特征工程简介

（I）特征工程可以解决什么样的问题？

Actually the sucess of all Machine Learning algorithms depends on how you present the data.

Better feature means flexibility. Better feature means simpler models. Better feature means better results.

（II）什么才是特征工程？

Feature Engineering is the process of transforming raw data into features that better represent the underlying problem to the predictive models, resulting in improved model accuracy on unseen data.
—— Jason Brownlee

Feature Engineering is manually designing what the input x’s should be.
—— Tomasz Malisiewicz

（IV）特征的构造过程

［4］特征的构造：

（4.1）标准化（Standardization）

（4.2）归一化（Normalization）

$f(x)=\log(1+x):[0,+\infty)\rightarrow [0,+\infty),$

$f(x)=x/(x+1):[0,+\infty)\rightarrow [0,1).$
（4.3）特征的离散化（Discretization）

（4.4）特征的二值化（Binarization）

（4.5）特征的交叉

[5] 选择特征的常用方法：

（5.1）过滤（Filter）

$\rho_{XY}=cov(X,Y)/(\sigma_{X}\sigma_{Y})\in [-1,1]$

（5.2）包装（Wrapper）

（5.3）嵌入（Embedding）