一种基于邮件列表的软件问答信息抽取方法  被引量:1

Mailing List Based QA Information Extraction Approach

在线阅读下载全文

作  者:罗宇翔[1,2] 邹艳珍[1,2] 金庸 谢冰[1,2] 

机构地区:[1]北京大学信息科学技术学院软件所,北京1000871 [2]高可信软件技术教育部重点实验室,北京100871

出  处:《计算机科学》2015年第12期23-25,35,共4页Computer Science

基  金:国家高技术研究发展计划(863)(2013AA01A605);国家重点基础研究发展规划(973)(2011CB302604);国家自然科学基金(61103024)资助

摘  要:开源项目通常会提供邮件列表来帮助用户更好地理解和使用开源项目。但由于邮件的数量巨大、邮件内容组织繁杂、问题不明确、答案定位困难等问题,用户在邮件查询过程中定位一个特定的软件问答信息要花费大量的时间和精力。为此,提出一种基于邮件列表的软件问答信息抽取方法。该方法通过对邮件的简单分类与标注,实现自动的问题句抽取和答案邮件选取,从而提升了用户进行邮件列表查询以及开源软件项目学习的效率。最后,通过实验验证了该方法的有效性。Open source projects often provide mailing lists to help users better understand and use open source software. However,developers often spend a lot of time to retrieve the emails when they want to find a special answer, because there are a huge number of emails with unclear question and complex organization. User usually take a lot of email conversations before they get a right answer. In the paper, we proposed and implemented a question & answer information extraction approach based on open source software's mailing list. It can automatically extract the question sentence and the corresponding best answer from the emails, which can help users search mailing list and learn open source software more effectively. We also did some experiments to verify the availability and the our approach.

关 键 词:软件复用 数据挖掘 邮件列表 软件问答 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象