从手动整理300份合同说起
去年底接手一个烂尾项目:把公司近三年的采购合同全部电子化归档。300多份PDF扫描件,每份少则5页多则30页,全部混在一起,没有目录,没有分类,文件名就是日期加一串编号。
我的第一反应是找实习生——但想想时薪和出错率,最后还是决定自己动手。先试了OCR在线识别平台,识别准确率感人,大量表格数据对不齐。花了三天识别完之后,更崩溃的事情来了:要把识别出来的文本归类到"合同主体"、"付款条款"、"验收条款"等十几类中,纯手工复制粘贴,又花了五天。
那段时...
智能分类
-
2026.06.03 | youres | 20次围观

