检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013
出 处:《计算机工程与设计》2009年第2期374-377,共4页Computer Engineering and Design
基 金:国家自然科学基金项目(60572112);江苏省高技术研究基金项目(BG2007028)
摘 要:临床行为数据经清理后仍然存在时间关系噪音,直接用于序列挖掘算法难以发现高质量的模式。提出了一种时间规范化模型,该模型定义了时序行为的顺序和并列关系,针对所给出的关系进行相交系数的计算,根据计算结果确定行为时间关系中的噪音,遵循规范后的所有行为相互之间既无噪音又保持原正确关系不变的准则,进行噪音清除。针对模型进行了算法实现,对样本数据的测试结果表明,经处理后的数据满足了后续的模式挖掘的要求。The time relationship noises still exist even after the clinical behavior data are cleaned, so it is difficult to discover high quality patterns from such data using sequential mining algorithms. A model for normalization is proposed, which defines ordinal and parallel relationships of the temporal behaviors. The intersection coefficient is worked out using the given relationships, according to the calculated results, the noises in relatioships is determined, and then the work of eliminating noises is carried out complying with the guideline that no noises exist and original correct relationships are kept among the normalized behaviors. To test the sampling data, an algorithm for the model is implemented. The testing results show the clinical data processed by the algorithm can fulfil following data mining needs.
关 键 词:临床行为 数据预处理 数据清理 时间规范化 时间关系噪音
分 类 号:TP274.2[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.44