searchdetail-综述开题网

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回

心血管大数据处理和分析云平台——多源异构数据抽取软件开题报告

   

1. 研究目的与意义

1 毕业设计的内容1.1 理论研究研究etl技术的实现方法,研究可视化开发技术,研究xml技术,研究数据库技术等。

1.2 系统开发1.2.1 主要功能多源异构的数据抽取软件是利用etl(抽取、转换、加载)对分布在不同系统、不同数据库的混合数据进行统一的数据整合。

软件具备以下功能: (1)数据加载:连接至目标系统并将结果写入及存储;(2)数据转储:读取不同文件格式的数据,并统一存储为数据分析与挖掘需要的文件格式;(3)数据迁移功能:根据用户需求实现不同数据库之间的数据迁移;(4)数据管理:对加载的数据集进行增、删、改操作以及基本的筛选工作;(5)数据展示功能:主要实现对整合前后数据的前台展示功能。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 文献综述

摘要:多源异构数据抽取软件能够对医疗内部的his、emr、lis、pacs等中的不同格式(结构化、半结构化和非结构化)的健康医疗数据进行一系列处理,包括采集、清洗和转换,并经过抽取获得元数据和规范化信息,转换为目标系统要求的数据格式,最后连接至目标系统并将结果写入及存储。

关键词:数据抽取;多源异构;etl1 研究背景和意义随着医疗数据信息化建设的愈加深入,越来越多的医疗信息管理系统被广泛应用于医疗行业,如his、emr、lis、pacs等。

在积累海量医疗数据的同时很多医院都面临这样的问题:病人信息不能完全共享,从而形成多个信息孤岛,而孤立的电子医疗数据难以适应医疗行业未来的发展。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 设计方案和技术路线

1 设计方案本系统为实现对医疗数据的抽取整合功能,选择了可扩展的、具有灵活性的xml技术作为桥梁,设计了一种中间件和etl结合的异构数据转换系统结构。

在该系统中,以xml存储关系表数据,以xml schema存储关系表模式,建立起关系模式到xml模式的可靠映射。

并且系统采用b/s架构,便于使用的同时,又利用web服务屏蔽了数据源的异构,为用户提供一个统一的访问接口,实现对异构数据转换的调用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 工作计划

2022年12月01日-12月15日:收集资料,在不断修正中形成较为具体的研究方法;撰写论文粗纲,进行毕设选题申请、选题研究; 2022年12月26日-2022年1月31日:读文献,查资料,完成文献综述,完成开题;2022年01月01日-02月28日:软件需求分析、系统界面设计;撰写论文大纲;2022年03月01日-03月15日:系统实现关键词抽取功能;整理相关资料和数据;2022年03月16日-03月31日:系统实现数据整合功能;论文形成初稿;2022年04月01日-04月30日:测试软件,根据测试结果进一步完善程序代码;修改论文,形成二稿;2022年04月30:提交《毕业设计(论文)中期检查表》;2022年05月04日-05月10日:论文中期检查;2022年05月11日-05月19日:系统平台增量;论文修改,进行格式调整;2022年05月20日-05月31日:系统平台整合;论文定稿;答辩前准备工作;2022年06月01日-06月10日:论文答辩。

5. 难点与创新点

特色:采用XML与JSON相结合的数据传输与存储方式;设计了一种中间件和ETL结合的异构数据转换系统结构。

创新:本数据抽取软件既满足对异构数据的进行统一整合的功能,又满足从医疗数据中抽取出数据挖掘所需要的关键词的功能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。