什么是数据挖掘?

数据挖掘是从大量不完整、有噪声、模糊和随机的数据中提取隐藏的、未知的但潜在有用的信息和知识的过程。

数据挖掘过程:

定义问题:明确定义业务问题,确定数据挖掘的目的。

数据准备:数据准备包括:选择数据——从大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理——数据再处理,包括检查数据的完整性和一致性、去噪、填充缺失字段、删除无效数据等。

数据挖掘:根据数据函数的类型和数据的特点,选择相应的算法,对净化转换后的数据集进行数据挖掘。

结果分析:对数据挖掘的结果进行解释和评价,并转化为最终能被用户理解的知识。