检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江工商大学信息与电子工程学院,杭州310018
出 处:《电脑编程技巧与维护》2010年第20期23-25,共3页Computer Programming Skills & Maintenance
基 金:浙江省科技计划项目:面向中小企事业单位应用的网络综合管理服务平台(2008C21093);浙江工商大学学生创新项目(1120XJ1709198)
摘 要:由于目前常见的文本抄袭检查系统都存在对文本的关键信息选择不准确的问题,从而影响了判断的准确性。开发的中文文本抄袭检查系统在采用k-grams算法的基础上,利用基于统计的中文分词技术对其改良。实验结果表明通过改良可以使系统更有效地选取关键信息,提高判断的准确性。The current common copy detection systems cannot select the key information in the text exactly so they have the problem in the accuracy of their judgments. For that reason, the Chinese text plagiarism checker we make is based on the kgrams algorithm, and it utilizes the Chinese word segmentation based on statistical techniques for improvement. The experiments show that after the improvement, the system can be more effective in selecting the key information so it can be more accurate.
关 键 词:改良 关键信息 抄袭检查系统 k-grams算法 中文分词
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222