检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国刑事警察学院 [2]山东警察学院
出 处:《警察技术》2024年第2期73-77,共5页Police Technology
基 金:中国刑事警察学院研究生创新能力提升项目(编号:2023YCYB32)。
摘 要:中文输入法软件在日常生活中的使用非常频繁,词库包含许多能够反应用户行为习惯的关键词。目前关于中文输入法词库的取证研究多为对词库中存储字词的提取与词频分析,并不能高效地为侦查人员提供案件相关线索。针对以上问题,提出了结合词嵌入技术的中文输入法词库取证模型,在输入法取证中使用Word2Vec算法中的Skip-Gram模型提取案件相关文本的词向量,并结合向量的关联性分析,补充字典。通过将基于该模型研发的取证工具与常见电子数据取证工具对同一检材的取证结果进行对比,可以验证模型相对高效地提取词库中与案件相关的关键词,为公安机关打击违法犯罪提供借鉴。
关 键 词:词嵌入技术 中文输入法词库 电子数据取证 Skip-Gram模型
分 类 号:D631.2[政治法律—政治学] TP391.14[政治法律—中外政治制度]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7