当前位置:首页> 滚动 >

合合信息瞄准版面分析技术,助力实现文档识别更加精确_世界讯息

时间:2023-07-06 11:21:43    来源:洞察经理人


(相关资料图)

大量的图片、表格等非文字内容通常同时存在于一篇普通的文档图像中,形成版式差异,使得传统的版面分析方法在进行版面布局分析和表格处理时会明显受制。在应对不同场景下,文档图片被拍照、扫描成电子文档过程中时常出现漏字、错位等效果存在缺陷的情况。

针对于此,人工智能及大数据科技企业合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,助力使用者从各类复杂的图片文档中精准获取信息。

据合合信息工作人员介绍,版面分析任务主要包括物理版面分析(或称为几何版面分析)和逻辑版面分析两类,前者主要解决区域分割问题,关注的是文档图像的物理布局,后者则关注区域之间的区域语义分类和逻辑关系。

因此,合合信息通过引入全卷积神经网络(FCN)和图神经网络(GNN)两种深度学习的算法,并结合文本区域的几何坐标、视觉特征、文本语义等多种模态信息对文本阅读顺序进行预测,显著提升了文档图像的分析结果。

合合信息智能文字识别服务平台对存在图片、表格的复杂文档进行识别

基于深度学习的方法,合合信息将文档图像切分为文本、图形、公式、表格、印章等不同类型的内容区域,并分析区域之间的逻辑关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,可以更好地理解文档的结构和内容,并提取出有用的信息。

此外,合合信息表格结构解析方法在逻辑版面分析中也发挥了重要作用。在表格识别还原中,合合信息利用自上而下的方法以及端到端图像到标记的方法等,保证区域内容的完整性的同时,显著提升检测准确率。

版面分析是文档图像还原的核心,通过解决版面分析的痛点,合合信息助力各界用户将图像文档以数字化的手段更精准地转化为文档数据,应用于多种使用场景、提升工作效率。未来,合合信息将继续深耕复杂版面文档和拍照变形文档的分析识别工作,争取得到更多的应用突破。

标签:

上一篇:神奇公式

下一篇:最后一页

合合信息瞄准版面分析技术,助力实现文档识别更加精确_世界讯息

大量的图片、表格等非文字内容通常同时存在于一篇普通的文档图像中,形

2023-07-06

神奇公式

神奇公式巴菲特先生说:一生富一次就可以了。这句话真实内涵是人的一生

2023-07-06

中央气象台发布高温橙色预警 焦点速递

人民网北京7月6日电(记者杨虞波罗)据中央气象台预计,7月6日白天,华

2023-07-06

“青信通”App上线试运行-环球新资讯

青海新闻网·大美青海客户端讯7月4日,记者从青海省市场监督管理局获悉

2023-07-06

世界即时:新疆克孜勒苏州阿图什市发生3.4级地震 震源深度10千米

新疆克孜勒苏州阿图什市发生3 4级地震震源深度10千米---中国地震台网正

2023-07-06

新一批支付牌照续期结果出炉 12家成功续展

昨日,人民银行公布非银行支付机构《支付业务许可证》续展公示信息(20

2023-07-06

沙漠中的“大章鱼”, 外形和八爪鱼十分相似, 已经存活了1千多年 世界即时

提起章鱼,大家就会想到那些在海水中肆意畅游,受到攻击还会喷出墨汁的

2023-07-06

2023上海铝工业展:永杰新材料展厅风采_世界快资讯

鸣蜩之月,沪上铝展,百家争鸣。7月5日-7日,2023年中国国际铝工业展强

2023-07-06

【国际漫评】法国骚乱让美媒很兴奋啊!

“美国媒体正饶有兴趣地关注法国局势”,法国BFMTV电视台2日用这样

2023-07-05

石头科技:7月3日张磊减持公司股份合计300股|当前滚动

证券之星讯根据7月5日市场公开信息上市公司公告及交易所披露数据整理石

2023-07-05