临床行为模式挖掘的数据预处理  被引量:4

Data preprocess for mining clinical behavior patterns

在线阅读下载全文

作  者:王珏[1] 杨鹤标[1] 

机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013

出  处:《计算机工程与设计》2009年第2期374-377,共4页Computer Engineering and Design

基  金:国家自然科学基金项目(60572112);江苏省高技术研究基金项目(BG2007028)

摘  要:临床行为数据经清理后仍然存在时间关系噪音,直接用于序列挖掘算法难以发现高质量的模式。提出了一种时间规范化模型,该模型定义了时序行为的顺序和并列关系,针对所给出的关系进行相交系数的计算,根据计算结果确定行为时间关系中的噪音,遵循规范后的所有行为相互之间既无噪音又保持原正确关系不变的准则,进行噪音清除。针对模型进行了算法实现,对样本数据的测试结果表明,经处理后的数据满足了后续的模式挖掘的要求。The time relationship noises still exist even after the clinical behavior data are cleaned, so it is difficult to discover high quality patterns from such data using sequential mining algorithms. A model for normalization is proposed, which defines ordinal and parallel relationships of the temporal behaviors. The intersection coefficient is worked out using the given relationships, according to the calculated results, the noises in relatioships is determined, and then the work of eliminating noises is carried out complying with the guideline that no noises exist and original correct relationships are kept among the normalized behaviors. To test the sampling data, an algorithm for the model is implemented. The testing results show the clinical data processed by the algorithm can fulfil following data mining needs.

关 键 词:临床行为 数据预处理 数据清理 时间规范化 时间关系噪音 

分 类 号:TP274.2[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象