什么是结构化文字识别?就是不但要将文字识别出来,还要形成结构化的文字。具体来说,就是将识别结果保存成由表头(字段名)和对应的内容(值)组成的excel之类的文件,如表头为姓名、性别,第二行内容则对应为张三、男。为什么要将识别结果结构化?主要是方便后期的查询和阅读、处理(如导入数据库)等。结构化文字识别主要应用在证件和票据等有明显结构特征的图片文字识别上。
目前,市面上的文字识别类软件一般还只能将图片上的文字识别成纯文本或带排版的word文档,只有少数的可识别成excel,极少数可以识别成结构化的excel数据,能批量叠加识别成excel结构化数据的软件少之又少,而对于企业(单位)来说,随着人工成本的不断提升,工作步伐的不断加快,竞争状况的不断加剧,这方面的需求又显得异常的迫切,如何更快、更好、成本更低地完成数据的录入成了各大单位迫在眉睫的事。
眼精星表格文字识别系统厚积薄发,推出了支持发票及各类证件、卡片的结构化文字识别功能,支持将各类票据,能将数十张图片文字识别到一张excel表中,并能形成结构化数据,大大降低了用户的录入成本,节省了录入时间,提升了录入效率。