近日,软云科技自主研发的“一种表格结构识别方法及系统”正式获得国家发明专利授权(专利号:ZL 2025 1 0180214.X)。这一技术突破将显著提升“软云 AI 档案数字化平台”在处理老旧历史档案表格时的精准度和效率,标志着我们在计算机视觉和图像处理领域的技术实力再上新台阶。
该专利技术针对档案中表格边界不清、文字干扰等难题,创新性地提出了一套完整的解决方案:
•智能预处理:通过动态调整卷积核大小,精准分离文字与表格线条。
•高级降噪算法:结合 LSD 线段检测技术,有效还原破损、模糊的表格结构。
•智能补偿系统:独创的线条补偿算法可自动修复断线表格,提升识别准确率。
特别适用于处理年代久远的档案资料,解决了传统 OCR 技术面对复杂表格时的识别困境。
“软云 AI 档案数字化平台”不仅是专利技术的落地载体,更是一套完整的档案数字化解决方案。平台深度融合 OCR 引擎与大模型技术,实现了从图像处理到智能交付的全流程自动化。
•图像处理:通过结合OCR与版面分析技术,能智能精准地消除图像中的订孔、污点,有效规避了业界常见的文字误删痛点,保障档案原始信息完整性。
•图片质检:基于AI大模型的档案图片质检,不仅能精准区分档案结构(封面、目录、备考表等),更能智能化检测漏缺页及图像倾斜、污点等质量问题,为数字化成果筑起坚实质量防线。
•智能著录:无需模板框选即可智能识别并提取户籍、人事、司法、古籍等各类印刷体、繁体及手写体档案信息的高效著录能力。
•开放鉴定审核:平台依据预设规则自动完成档案开放鉴定审核,并清晰提供判定依据条目,显著提升了审核效率和透明度。
近期上线的“智能导出交付”功能更是解决了传统交付流程中的痛点。通过“多层级、多格式”交付包一键配置和智能断点续传技术,用户无需再担心因网络中断导致的重复劳动,数据交付效率显著提升。
未来,软云科技将继续深耕档案数字化领域,致力于通过技术创新,推动档案数字化赛道的发展,提升行业整体效率和质量,为人类文明的传承与保护贡献更多力量。