检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国刑事警察学院
出 处:《警察技术》2024年第4期30-34,共5页Police Technology
摘 要:信息化背景下,部分嫌疑人经常在以微博为代表的网络社交平台伪装身份进行作案。为了应对此类新型涉网犯罪案件,更好地刻画嫌疑人身份,通过爬取特定微博用户的语料作为研究对象,详细研究了不同年龄群体的微博言语特点,并且结合统计学,分析了不同特征在各群体之中出现的概率,从而帮助办案人员完成对嫌疑人的年龄识别。模型建立方面,首先将年龄分为四个等级,通过观察样本中的言语特征并且结合言语特征的出现率来完成模型的搭建。模型预测方面,尝试在自动化判别上引入五种分类模型,其中多分类Logistic回归模型预测正确率最高,能够达到70%左右,在特征出现率较高的情况下,该模型可为办案人员在年龄的判断上进行辅助验证。
关 键 词:言语识别 微博言语 年龄 Logistic预测分析
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.225.95.186