商业智能前端工具的研究与实现开题报告
1. 研究目的与意义
传统的商业智能前端工具缺乏语义的支持,前端工具展示给用户的是多维数据立方体,用户需要对多维数据立方体的结构有所了解才能进行各种数据分析操作。在数据建模过程中添加一步业务建模,并将业务建模的语义信息引入到商业智能前端展示中来一方面可以向用户提供数据的业务视图,另一方面,有了语义的支持,olap中的各种下钻、切片上卷等操作可以依据预定义的各种业务规则来执行,使得olap分析更具目标性。采用mashup作为构建商业智能前端展示的基础框架可以让用户更加随意的配置自己所需的各类分析服务,能够提高商业智能平台中应用的开发速度。同时mashup本身是协作共享的,一个用户通过mashup框架创建的商业智能应用可以与其他人共享,从一定程度上可以实现商业智能系统对协作共享的要求。基于以上讨论本文预期解决以下问题:
1.将数据仓库建模中业务建模的信息引入商业智能的前端展示,为分种查询分析操作提供语义支持。
2.以mashup的方式实现商业智能前端用户界面的创建与配置,同一个mashup文档中的各个数据分析单元中的数据能够自动关联更新。
2. 国内外研究现状分析
商业智能已经得到了非常广泛的应用,microsoft、ibm、sap和oracle等公司也有各自成熟的产品线,提供了从数据建模到整个商业智能平台部署在内一系列的工具[1,9-11]。目前传统的商业智能平台大都采用soa架构,数据挖掘、报表生成、olap等作为服务运行于soa架构之上。商业智能平台使用关系型数据库或多维数据库作为数据仓库,当使用关系型数据库做数据仓库时,多使用星型模型作为关系数据表的组织结构。数据仓库之上是olap服务,olap以多维数据立方体的形式组织和管理数据仓库中的数据[12]。商业智能前端工具从olap获取数据展示给终端用户,前端工具的各种查询分析操作也将交由olap处理。olap向前端工具提供的数据是以各种维度、度量组织起来的结构化的数据,所以前端工具的各种查询也是在维度、度量上进行的下钻、切片上卷等结构化的查询,这需要使用者对数据的组织结构有一定的了解。
商业智能前端工具允许用户自己选取数据集创建个性化的前端分析界面,microsoft为excel提供了powerpivot插件[13],用户可以使用excel连接sqlserveranalysisservices构建交叉表和各种图形显示。microstrategy提供了基于web的microstrategyweb作为其商业智能解决方案的前端工具,用户使用microstrategy的web可以方便的访问已经预先定义好的多维数据立方体和olap服务[14]。arcplan[15]作为sap环境下应用最为广泛的商业智能前端工具提供了从多维分析案例的创建到配置发布的一系列工具,在arcplan中用户可以选择所需数据集,选取各种数据显示工具,定义数据之间关系。而且arcplan也支持交互式的查询。qlikview[16]是近来比较流行的商业智能前端工具,其最大的特点在于其数据的自动关联更新能力,同一个分析文档内的数据,会随着用户的鼠标点击操作同步更新。与其他传统商业智能前端工具不同的地方在于,qlikview利用的是自身in-memory技术[17][18]实现数据的各种分析查询操作。qlikview的数据自动关联更新能力是其有别于其他基于olap的前端工具的不同之处和特色,但是qlikview的in-memory技术与olap技术相比,不适合处理大量的数据。qlikview本身是桌面版本的,也有研究人员采用类似的in-memory技术实现了qlikview的web版本[19]。
现阶段一个新的流行趋势是在商业智能平台中引入mashup功能[6,20-22]。mashup是一种通过组合各类服务创建新的应用服务的方式,yahoopipe就是mashup在互联网上的一个应用。企业中也在逐渐引入商业环境下的mashup框架。通过mashup,企业用户可以通过组合多个服务创建一个分析应用,或是将异构的数据通过mashup融合在一起。对于企业中突发的情景,用户可以使用mashup很快的创建出一个针对特定情况的分析应用。ibm推出了mashupcenter用于企业mashup。arcplan也开始在其产品中加入对mashup的支持。
3. 研究的基本内容与计划
1.olap查询推荐
用户的一次交互查询会话总是由一个结果集出发,到一个结果集终止。由于商业智能平台本身包含了大量的数据,用户很难快速准确的在众多的维度和度量划分中选取下一步查询的维度、度量,因此查询推荐系统应运而生。查询推荐系统根据用户当前查询和系统的历史查询记录,向用户推荐查询语句。文献[28]提出了一个通过分析历史查询会话和当前查询会话,向用户查询推荐最为相近的历史查询语句的olap查询推荐框架。这个查询框架的缺点在于没有考虑到数据的语义信息,仅从数据单元的数据变动趋势上考量查询之间的相似性。而且推荐查询语句这一目标过于详细,用户在进行交互查询过程中,最主要的问题是不知道如何选取合适的维度、度量作为下一步查询的限制条件,所以本课题将侧重于通过分析查询过程的语义信息来向用户推荐合适的维度、度量条件。这一部分涉及到的关键问题如下:
1.用户查询过程的表示与存储。
4. 研究创新点
传统的商业智能前端工具缺乏语义的支持,前端工具展示给用户的是多维数据立方体,用户需要对多维数据立方体的结构有所了解才能进行各种数据分析操作。在数据建模过程中添加一步业务建模,并将业务建模的语义信息引入到商业智能前端展示中来一方面可以向用户提供数据的业务视图,另一方面,有了语义的支持,olap中的各种下钻、切片上卷等操作可以依据预定义的各种业务规则来执行,使得olap分析更具目标性。采用mashup作为构建商业智能前端展示的基础框架可以让用户更加随意的配置自己所需的各类分析服务,能够提高商业智能平台中应用的开发速度。同时mashup本身是协作共享的,一个用户通过mashup框架创建的商业智能应用可以与其他人共享,从一定程度上可以实现商业智能系统对协作共享的要求。基于以上讨论本文预期解决以下问题:
1.将数据仓库建模中业务建模的信息引入商业智能的前端展示,为分种查询分析操作提供语义支持。
2.以mashup的方式实现商业智能前端用户界面的创建与配置,同一个mashup文档中的各个数据分析单元中的数据能够自动关联更新。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。