检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华能招标有限公司,北京102209 [2]中国华能集团清洁能源技术研究院有限公司,北京102209
出 处:《中国管理信息化》2024年第1期173-178,共6页China Management Informationization
摘 要:本论文研究智能招投标系统中针对供应商投标PDF电子文档的信息提取技术。研究内容包括PDF文本信息提取和表格提取中的表格结构还原和数据对齐问题。通过设计并实现相关功能和算法,包括软件架构、内容解析器类算法、文本提取模型和表格提取模型,实现了自动识别和提取关键信息并保存到数据库中。此外,将OCR技术与信息提取技术相结合,解决了扫描PDF文件的识别和提取问题,提高了文本和表格信息的完整性和准确性。本论文的研究成果对于存档历史投标文件的快速处理和专家评标过程中的信息提取具有重要意义,为智能招投标系统的进一步发展提供了支持。
关 键 词:智能招投标系统 供应商投标 PDF电子文档 信息提取技术 非结构化文档
分 类 号:F253.2[经济管理—国民经济] TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.228.10