大家好,我是小小明。
最近很多朋友和同事问我如何将图片转Excel表格,老实说这方面现成的工具基本都不好使,不过百度AI有支持进行表格图片识别的接口,我们只要按照百度AI的要求传入相应的数据进行识别即可。
需求与技术点
需求,有两张超长的表格图片:
现在希望将其识别后转成Excel表格。
经查询两张图片的分辨率分别为791×7616和791×7531,可见其长度非常宽。
本文涉及的技术点:
- 图片分段切片
- 图片数据转base64编码
- keyring密钥环的使用
- 百度AI表格识别接口的使用
- 分段表格的合并
主要难点:图片切分如何保证切分处包含完整的单元格
百度AI接口
首先我们进入百度AI,查看开放能力-》文字识别-》表格文字识别:
https://ai.baidu.com/tech/ocr_others/table
查看技术文档:
https://ai.baidu.com/ai-doc/OCR/Ik3h7y238