藏文网页

作品数:15被引量:31H指数:4
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:胥桂仙安见才让戴玉刚高红梅艾金勇更多>>
相关机构:西北民族大学青海民族大学西藏大学中央民族大学更多>>
相关期刊:《中文信息学报》《图书馆理论与实践》《西北民族大学学报(自然科学版)》《西藏大学学报(社会科学版)》更多>>
相关基金:国家自然科学基金西藏自治区自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于LDA模型的藏文文本主题发现方法研究
《中国信息界》2024年第2期176-179,共4页韩佳晖 白韦娟 艾金勇(指导) 
西藏民族大学校内项目“基于融合特征的藏文文本分类方法研究”(22MDY022)。
引言。为了加快藏文信息化建设进程,自治区“十四五”相关规划中把推动藏文信息技术标准化工作列入重要推进计划[1]。藏族地区的网络普及率逐年攀升,藏文信息处理技术和藏文使用地区网络通信快速发展[2],互联网成为藏文使用地区人民传...
关键词:文本数据 共享资源 藏文文本 藏文信息处理技术 网络通信 藏文网页 指数式 网络普及率 
基于文档摘要的藏文网页消重研究
《电子技术与软件工程》2018年第10期148-148,213,共2页李加才让 安见才让 
网页消重一方面能解决互联网上存在的信息冗余问题,另一方面能减轻用户的浏览负担,对提高搜索引擎工作效率起着至关重要的作用。藏文网页亦不例外。此文以文档摘要为特征,计算文档摘要的信息指纹。信息指纹转换成固定位数的二进制数值...
关键词:自动摘要 藏文网页 信息指纹 相似度 
藏文网页主题爬虫系统的实现
《电子技术与软件工程》2018年第10期157-158,共2页洛松求培 安见才让 
随着藏文信息技术的发展,互联网上的藏文信息呈爆炸式增长,无疑变成了最密集最丰富的网络信息资源,通用搜索引擎的功能无法满足一般用户的需求。信息服务要求更精确、精准,定题采集下的搜索引擎成了新的发展趋势。针对某一领域关注的信...
关键词:贝叶斯分类器 藏文主题爬虫 藏文分词 藏文网页 
结合语义知识的藏文网页主题句抽取算法研究被引量:1
《图书馆理论与实践》2017年第8期39-44,共6页艾金勇 
西藏自治区高校青年教师创新支持计划项目"基于藏文Web文本的关联知识挖掘方法研究"(项目编号:QCZ2016-44);西藏自治区自然科学基金项目"基于语义的藏文百科知识问答系统关键技术的研究"(项目编号:2016ZR-MY-04)的阶段性研究成果
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主...
关键词:藏文网页 语义信息 主题句 抽取 
基于文本密度的藏文网页正文提取方法被引量:3
《计算机时代》2017年第8期46-47,51,共3页洛松求培 安见才让 
青海省科技厅项目资助(2016-ZJ-Y04)
互联网的发展带动了另一种形式的信息传播,人们越来越多地依赖于电子产品,Web网页也随之变为了最大的信息源,利用好这些资源便涉及信息提取。为了从Web网页中获取关键藏文信息,文章提出了基于文本密度的藏文网页正文提取方法,利用半结...
关键词:藏文信息 藏文网页正文提取 HTML WEB网页 
基于XML文档的藏文网页倒排索引的研究与实现被引量:2
《软件工程》2017年第6期12-14,共3页扎西拉旦 安见才让 
青海省科技厅(2016-ZJ-Y04)项目资助
如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道,倒排索引又是搜索引擎的核心技术之一,倒排索引直接影响搜索引擎检索的结果和响应的速度。之所以文章详细介绍了一个自主开发的藏文网页倒排索引系统,它...
关键词:XML 藏文网页 倒排索引 
融合语义知识的藏文网页关键词提取方法研究被引量:4
《图书馆学研究》2017年第3期59-64,77,共7页艾金勇 
西藏自治区高校青年教师创新支持计划项目"基于藏文Web文本的关联知识挖掘方法研究"(No:QCZ2016-44);西藏自治区自然科学基金项目"基于语义的藏文百科知识问答系统关键技术的研究"(No:2016ZR-MY-04)的阶段性成果
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算...
关键词:藏文网页 TF-IDF 语义扩展 关键词抽取 
基于DIV标签分段的藏文网页正文提取研究被引量:4
《西藏大学学报(社会科学版)》2016年第2期70-77,共8页才让叁智 赵栋材 
2015年度西藏自治区自然科学基金项目"藏文搜索引擎关键技术研究"(项目号:2015ZR-14-9);2015年度西藏自治区自然科学基金项目"基于逐字匹配的藏文分词技术与未登录词研究"(项目号:2015ZR-14-10);2013年度国家自然科学基金重大项目"跨语言社会舆情分析基础理论与关键技术研究"(项目号:61331013)阶段性成果
文章针对藏文电子文献资源匮乏、文本资源不规整、收集困难等问题,提出了基于DIV标签分段的藏文网页正文提取算法,该算法将原始网页信息分割为页面信息中与DIV元素等量的信息段,再对段中标签等非正文信息进行删除,最终形成该页正文。实...
关键词:藏文网页 分段 正文信息 DIV元素 标签 
语义词库关联的藏文Web语义检索系统研究与实现被引量:3
《西藏大学学报(社会科学版)》2015年第5期90-95,共6页高红梅 魏西峰 王崧华 扎西 
2014年度西藏大学国家级大学生创新创业训练计划项目"藏文Web语义检索的研究与实现"(项目号:201410694018);2013年度国家自然科学基金重点项目子课题"藏文词法分析系统与舆情监测知识库构建"(项目号:61331013);2013年度青年科研培育基金项目"西藏旅游目的地营销系统运营模式研究"(项目号:ZDPJSK2013080)阶段性成果
文章依据所抓取的大量藏文网页URL,对相关的藏文信息网页进行除噪去重处理,得到较为完善的藏文信息库。对用户要查询的藏文信息进行预处理和藏文语义标注,通过基于本体的词汇相关性算法,扩展藏文的查询词汇,建立一对多的藏语词汇联系,...
关键词:藏文网页 信息库 藏文语义相关 藏文语义扩展 
领域本体的藏文主题爬虫搜索策略研究被引量:1
《计算机应用与软件》2015年第9期68-71,共4页高红梅 仁青诺布 普次仁 
国家自然科学基金重点项目(61331013);国家自然科学基金项目(61165013);西藏大学青年培育基金项目(ZDPJZK201302)
针对目前没有通用藏文搜索引擎的情况,提出一种基于领域本体的面向主题的藏文信息爬取策略。策略首先根据藏文和藏文编码的特点,判断出藏文Web并进行映射转换。然后通过构建领域本体,进行概念相似性计算,得到领域主题相关性网页。实验...
关键词:本体 相似度计算 藏文网页 主题发现 
检索报告 对象比较 聚类工具 使用帮助 返回顶部