浅析：基于数据挖掘及其在超市CRM的应用网经社电子商务研究中心电商门户互联网+智库

当前位置：100EC>数字研究>浅析：基于数据挖掘及其在超市CRM的应用

浅析：基于数据挖掘及其在超市CRM的应用

作者：来源：发布时间：2013年12月06日 14:52:22

(电子商务研究中心讯)　　前言

　　随着信息处理技术的不断发展，信息的存储、管理使用和维护显得越来越重要，而传统的数据库管理系统很难满足其要求，表现为：数据量成几何级数的增长，不同部分的数据难以集合，访问数据的响应性能不断降低。要使数据能够发挥其最佳功效，更好地为用户服务，数据仓库的出现为用户处理所需要的决策信息提供了一种有效的方法。

　　1、相关理论和技术基础

　　数据挖掘的定义：数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

　　数据挖掘其实是一个逐渐演变的过程。电子数据处理的初期，人们就试图通过一些方法来实现自动决策支持，当时机器学习成为人们关心的焦点。机器学习的过程就是将一些已知并成功解决的问题作为范例输入计算机，机器通过学习这些范例，总结并生成相应的规则。随后，随着神经网络技术的形成和发展，人们的注意力转向知识工程。知识工程不同于机器学习，不是为计算机输入范例，由其生成的规则，而是直接为计算机输入已被代码化的规则，而计算机是通过使用这些规则解决某些问题。专家系统就是这种方法所得到的成果，但有投资大和效果不甚理想等不足。20世纪80年代人们又在新的神经网络理论的指导下，重新回到机器学习的方法上。并将其成果应用于处理大型商业数据库，出现了数据库中的知识发现，简称KDD(Knowledged Discovery in Database)。它泛指从所有数据源中发掘模式的联系和方法，人们接受了这个术语。1995在美国计算机学会(ACM)上，提出了数据挖掘(DM，DataMining)概念作为知识发现过程的关键步骤，但是现在人们对于KDD和DM这两个概念通常不加以区别，所以往往混用。

　　2、数据挖掘中的聚类算法

　　聚类算法是本文重点研究的对象，通过介绍聚类算法的一些基本原理和概念，将此算法在CRM系统中作出一个应用。

　　聚类：聚类是开始分析的好方法，特别是面临大量复杂的可能有很多内部结构的数据集。通过使用这种方法，分析者可以将一个大问题按照特征分成一组。，这些聚类提供了对其中成员的描述。通过提供分类这些聚类的方法，我们就能够对问题有个大致的了解。聚类就是将物理或抽象的集合分组成为由类似的对象组成的多个类的过程。聚类的结果是使同一个类别内的对象具有较高的相似度，而不同的类别的对象之间差别很大。聚类增强了人们对客观现实的认识，是概念描述和偏差分析的先决条件。（来源：IT专家网）

浙江网经社信息科技公司拥有18年历史，作为中国领先的数字经济新媒体、服务商，提供“媒体+智库”、“会员+孵化”服务；（1）面向电商平台、头部服务商等PR条线提供媒体传播服务；（2）面向各类企事业单位、政府部门、培训机构、电商平台等提供智库服务；（3）面向各类电商渠道方、品牌方、商家、供应链公司等提供“千电万商”生态圈服务；（4）面向各类初创公司提供创业孵化器服务。

网经社“电数宝”电商大数据库（DATA.100EC.CN，免费注册体验全库）基于电商行业18年沉淀，包含100+上市公司、新三板公司数据，150+独角兽、200+千里马公司数据，4000+起投融资数据以及10万+互联网APP数据，全面覆盖“头部+腰部+长尾”电商，旨在通过数据可视化形式帮助了解电商行业，挖掘行业市场潜力，助力企业决策，做电商人研究、决策的“好参谋”。