结合词嵌入技术的中文输入法词库取证模型研究  被引量:1

Research on the Development Model of Intelligence Community Policing to Empower Community Risk Govemance

在线阅读下载全文

作  者:王子昂 汤艳君[1] 孙晓磊 

机构地区:[1]中国刑事警察学院 [2]山东警察学院

出  处:《警察技术》2024年第2期73-77,共5页Police Technology

基  金:中国刑事警察学院研究生创新能力提升项目(编号:2023YCYB32)。

摘  要:中文输入法软件在日常生活中的使用非常频繁,词库包含许多能够反应用户行为习惯的关键词。目前关于中文输入法词库的取证研究多为对词库中存储字词的提取与词频分析,并不能高效地为侦查人员提供案件相关线索。针对以上问题,提出了结合词嵌入技术的中文输入法词库取证模型,在输入法取证中使用Word2Vec算法中的Skip-Gram模型提取案件相关文本的词向量,并结合向量的关联性分析,补充字典。通过将基于该模型研发的取证工具与常见电子数据取证工具对同一检材的取证结果进行对比,可以验证模型相对高效地提取词库中与案件相关的关键词,为公安机关打击违法犯罪提供借鉴。

关 键 词:词嵌入技术 中文输入法词库 电子数据取证 Skip-Gram模型 

分 类 号:D631.2[政治法律—政治学] TP391.14[政治法律—中外政治制度]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象