藏文PDF文档转换为Word文档方法  

The Method of Tibetan PDF Files Converted into Word files

在线阅读下载全文

作  者:赞拉公 贡保加 完玛道吉 安见才让[1] ZAN Lagong;GONG Baojia;WAN Madaoji;AN Jiancairang(School of Computer Science of Qinghai Minzu University,Xining Qinghai 810007,China)

机构地区:[1]青海民族大学计算机学院,青海西宁810007

出  处:《长江信息通信》2023年第11期117-120,共4页Changjiang Information & Communications

基  金:省部共建藏语智能信息处理及应用国家重点实验室、青海省藏文信息处理与机器翻译重点实验室基金项目(No.2021-Z-001)。

摘  要:各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件转换的正确率。The use rate of PDF and Word format files are extremely high in various office software such as word processing and storage,and there are problems of garbage characters and missing reading in Tibetan PDF files converted into Word files.There-fore,this paper has done relevant research and proposed solutions to such problems,Effectively improving the accuracy of con-version.

关 键 词:藏文PDF 藏文乱码 WORD文档 纠错 

分 类 号:H214[语言文字—少数民族语言]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象