智能访客机器人客户数据分析与挖掘系统研究与实现开题报告
1. 研究目的与意义
1.1研究的背景
数据挖掘是八十年代,投资人工智能研究项目失败后,人工智能转入实际应用时提出的。它是一个新兴的,面向商业应用的人工智能研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预言模型的经济学家之间没有技术的重叠。数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力。与数据挖掘密切相关的技术包括:1)机器学习机器学习是计算机科学和人工智能发展的产物,机器学习分为两种学习方式:自组织学习(如神经网络)和从例子中归纳上·规则(如決策树)2)统计统计本包括预言算法(回归)、抽样、基于经验的设计等,现在也开始支持数据挖掘。3)决策支持系纨4)数据仓库5)olap(联机分析处理)、datamart(数据集市)、多维数据库等将数据仓库、olap、数据挖掘等技术融合在一起,即构成企业决策分析环境。三、数据挖掘的社会背景数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中神秘,它不可能是完全正确的。客户的行为是与社会环境相关联的,所以数据挖掘本身也受社会背景的影响。比如说,在美国对银行信用卡客户信用评级的模型运行得非常成功。
1.2 研究的目的及意义
2. 研究内容和预期目标
2.1研究内容 用户画像,又称人群画像,是根据客户人口统计学信息,社交关系,偏好习惯和消费行为等信息而抽象出来的标签化画像。智能访客机器人的用户画像其实就是希望通过某些手段对用户做甄别,把访客分成彼此相同或不同的人群或个体,进而区别化提供服务。 本课题面向访客语音、图像、身份信息等数据,采用小样本学习、迁移学习等机器学习算法,探索基于小样本的访客用户画像构建;同时基于数据库、统计分析等技术,开发一个小型访客数据管理与分析挖掘系统,为智能访客机器人精准识别特定的访客人员提供数据支撑。 2.2预期目标 实现机器人对于不同用户之间的个性化交互。在深入数据结构、可视化软件开发实现等基本理论和方法基础上,通过所掌握的Java或Python等编程语言,并结合数据库技术以及软件工程等相关理论、技术,分析挖掘访客数据,开发一个智能数据处理系统。 |
3. 研究的方法与步骤
3.1研究方法
采用小样本学习、迁移学习等机器学习算法,探索基于小样本的访客用户画像构建;同时基于在深入数据结构、可视化软件开发实现等基本理论和方法基础上,通过所掌握的java或python等编程语言,并结合数据库技术以及软件工程等相关理论、技术,分析挖掘访客数据,数据库、统计分析等技术,开发一个小型访客数据管理与分析挖掘系统,为智能访客机器人精准识别特定的访客人员提供数据支撑。
3.2步骤
4. 参考文献
[1]tom.mitche,machine learning, mcgrawhill
[2]李航,统计学习方法,清华大学出版社,2012.
[3]周志华,机器学习,清华大学出版社,2016.
5. 计划与进度安排
(1)1月11日至2月15日分析课题,查找资料。
(2)2月16日至2月28日完成需求分析。
(3)3月01日至3月16日完成开题报告。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。