基于数据挖掘的电商家具产品共词聚类算法研究开题报告
1. 研究目的与意义
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘是伴随着数据仓库技术的发展而逐步完善起来的。数据挖掘主要是为了帮助商业用户处理大量存在的数据,发现其后隐含的规律性,同时将其模型化,来完成辅助决策的作用。
本研究拟采集淘宝指数的现成数据,采取共词分析法对某类热销家具,进行关键词共同出现的次数进行统计,并以此为基础对这些词进行分层聚类,揭示出这些词之间的亲疏关系,进而分析如何用更少的关键词来有效地描述家具产品,从而为设计更加精准的家具产品以满足市场的实际需求。2. 国内外研究现状分析
国外有很多刊物研究数据挖掘技术,并行计算、计算机网络和信息工程等其他领域的国际学会、学刊也把数据挖掘和知识发现列为专题和专刊讨论,甚至到了脍炙人口的程度。
与国外相比,国内对数据挖掘的研究稍晚,没有形成整体力量。目前的研究领域一般集中于学习算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。
3. 研究的基本内容与计划
研究内容:
利用数据挖掘和聚类算法对淘宝指数中的热销家具进行共词分析统计。
研究计划:
4. 研究创新点
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。现将联合淘宝指数,并分析出热销家具中的关键字,找出共词出现的频率,以期为精准营销提供依据。
聚类算法将从一个单独的工具发展为发现电商家具市场数据库中分布的一些深层的信息的研究手段,并能概括出每一类的特点,或者把注意力放在某一个特定的类上以作进一步的分析。
利用matlab从繁琐的运算中解脱,得出可视化结果,用社会关系网络分析软件进行建模与性能分析。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。