国家自然科学基金(60663008)

作品数:3被引量:9H指数:2
导出分析报告
相关作者:张志平赵小兵刘荣王丽娟唐长宁更多>>
相关机构:北京语言大学中央民族大学太原理工大学内蒙古师范大学更多>>
相关期刊:《太原理工大学学报》更多>>
相关主题:新闻文本文本分类高频词互信息字词更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于“中文新闻信息分类与代码”文本分类被引量:5
《太原理工大学学报》2010年第4期402-405,411,共5页张志平 
国家自然科学基金项目(60663008);国家语言资源监测与研究中心平面媒体语言分中心项目:基于"中文新闻信息分类和代码"的分类语料库建设方法研究资助
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。
关键词:文本分类 中文新闻信息分类与代码 新闻文本 
利用高频词和互信息面向特定领域提取多字词表达被引量:4
《太原理工大学学报》2009年第3期210-214,共5页刘荣 王丽娟 张志平 赵小兵 
国家自然科学基金资助项目(60663008)
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字...
关键词:多字词表达 特定领域 高频词 互信息 
面向现代汉语动态流通语料库的html To xml转换工具的设计和实现
《内蒙古师范大学学报(自然科学汉文版)》2008年第1期63-66,共4页唐长宁 张志平 赵小兵 
国家自然科学基金资助项目(60663008)
分析了目前HTML与XML格式的特点及现有的html to xml转换软件的不足,给出面向现代汉语动态流通语料库的html To xml软件的设计和实现过程.编码过程利用面向对象思想,使用Java编程语言,可以实现跨平台运行.用测试用例对软件做了相应测试...
关键词:HTML to xml转换软件 动态语料库 XML HTML 
检索报告 对象比较 聚类工具 使用帮助 返回顶部