检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李文彪 吴云芳 LI Wenbiao;WU Yunfang(School of Software and Microelectronics,Peking University,Beijing 102600,China;School of Computer Science,Peking University,Beijing 100871,China)
机构地区:[1]北京大学软件与微电子学院,北京102600 [2]北京大学计算机学院,北京100871
出 处:《中文信息学报》2023年第2期158-168,共11页Journal of Chinese Information Processing
基 金:国家自然科学基金(62076008,61936012)。
摘 要:文本难度分级是自然语言处理在教育领域的一个基础性研究课题,用于自动判定一篇文章的阅读难度。该文基于深度神经网络模型对汉语文本阅读难度进行了探索,提出了一种CNN+LSTM的难度分级模型,并结合分级语料的特点采用了变长卷积层和块结构。在教材测试集和人工构建的测试集上进行了详细的实验分析,该文的神经网络模型超越了传统机器学习方法和主流神经网络方法,在根据学段划分的5级数据上分级系统的正确率达到了75.4%。Readability assessment is to automatically determine the reading difficulty of a given document.Focusing on Chinese readability assessment,this paper proposes a CNN+LSTM difficulty classification model with the variable-length convolutional layer and block structure.Extensive experiments on school textbooks and a manual-constructed test set show that the proposed method achieves 75.4%accuracy on 5-level difficulty prediction,which is superior to the existing models.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.85.79