一种基于C#正则表达式的汉语文本信息检索方法  被引量:1

A Method for Chinese Text Information Retrieval Based on C# Regular Expression

在线阅读下载全文

作  者:宋培彦[1] 张冬梅[1] 

机构地区:[1]北京师范大学中文信息处理研究所,北京100875

出  处:《现代计算机》2009年第12期33-36,共4页Modern Computer

基  金:国家科技支撑计划项目课题(No.2007BAH05B01)

摘  要:C#中的正则表达式可以按照用户指定的模式从非结构化文本中提取信息,简单易用,功能强大。简要介绍C#正则表达式主要的语法格式和功能,结合汉语文本检索的实例,演示其使用方法。上机实验结果表明,C#正则表达式在处理汉语文本时的准确率和效率都是较高的,F值为95.53%。As a powerful and easy-to-use computer language, regular expression in C# can be used to extract information from unstructured text according to user’s specified mode. Introduces the main grammar expressions and functions of C# regular expression. Demonstrates the use based on some examples of Chinese information extraction, and the result of test indicates that both accuracy and efficiency are satisfactory, by which the F-measure is up to 95.53%.

关 键 词:正则表达式 语料检索 信息检索 中文信息处理 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象