基于SVM的中文报道关系识别方法研究  被引量:3

Research on Chinese story link detection based on SVM

在线阅读下载全文

作  者:王强[1] 张永奎[2] 

机构地区:[1]山西大学计算机与信息技术学院,太原030006 [2]计算智能与中文信息处理省部共建教育部重点实验室,太原030006

出  处:《计算机工程与应用》2008年第33期141-143,共3页Computer Engineering and Applications

基  金:国家自然科学基金No.60475022;山西省自然科学基金No.20041041;山西省回国留学人员基金(No.2002004)。~~

摘  要:针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。Via analyzing the characteristic of news in the Web,construct the feature vector using features from five entity categories:persons,time,location,organizations,and content.Using story time and entity relatedness for temporal or place vector when calculating their similarity and cosine similarity for others.All the features together with the entity relatedness are integrated by Support Vector Machine(SVM).Experimental results show that this method can improve system performance effectively.

关 键 词:报道关系识别 话题检测与跟踪 多向量表示模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象