基于风险短语自动抽取的上市公司风险识别方法及可视化研究  被引量:13

Risk Identification Method of Listed Companies Based on the Automatic Risk Phrase Extraction and Visualization

在线阅读下载全文

作  者:胡小荣[1] 姚长青[1] 高影繁[1] 

机构地区:[1]中国科学技术信息研究所,北京100038

出  处:《情报学报》2017年第7期663-668,共6页Journal of the China Society for Scientific and Technical Information

基  金:中央级公益性科研院所基本科研业务费专项资金项目"上市公司年报数据库建设及服务系统研发"(ZD2016-08);国家自然科学基金项目"科学基金项目产出专利对产业技术发展的影响研究"(L1624039);国家社会科学基金项目"面向科技型中小企业创新的技术竞争情报方法体系研究"(12CTQ030)

摘  要:上市公司作为证券市场的基石,其财务状况与风险信息是众多投资者与研究人员的关注焦点,而上市公司年报中的风险信息披露字段因其权威性与公开性成为研究者评估上市公司风险的研究依据。目前针对风险信息披露字段内容的研究仅停留在基于分词与词频统计的风险分析层面,而单个的词并不能很好地揭示不同风险主题的具体表现和语义内容。本文采用基于多因素拟合的风险短语识别技术,对沪深两市环保行业76家上市公司年报中"风险因素"的文字描述字段进行处理,得到环保行业不同风险主题文本中的主题短语,最后使用jQCloud词云图对风险主题短语进行可视化展示。The financial status and risk information of listed companies--the cornerstone of the securities market--is the focus of many investors and researchers, who usually conduct their researches based on the risk information in- voked in annual reports of listed companies. The current methods are only based on word segmentation and frequency statistics, althoueh a single word cannot capture the meaning, of text and tooics. This oaoer adaots the ohrase extraction technology based on multi-factor fitting into the risk assessment of 76 listed companies in the environmental protection industry in Shenzhen and Shanghai stock markets. Finally, we use jQCloud to visualize the theme phrase.

关 键 词:上市公司风险评估 互信息 左右熵 多因素拟合 可视化 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象