VLM 驱动 AI OCR

手写收货单转Excel
入库凭证AI提取,潦草字迹也能处理

手工逐张录入一张手写收货单平均需3分钟——复写纸多联单字迹逐联衰减、手写料号"6"与"9"难分、收订数量逐行核对,半天就没了。简录AI让你拍照上传,输入列名,AI按语义理解每张手写单据的关键字段,每页5-10秒,全部合并到一张Excel。

文件不用于模型训练 · TLS 1.3 传输加密

手写潦草字识别
复写纸多联单
合并导出Excel

从手写收货单中能提取哪些字段

输入你需要的列名,AI根据语义含义在每张手写收货单上自动定位对应的值——不管字迹是印刷还是手写、不管单据是白联还是复写纸最后一联。

供应商名称
入库单号
入库日期
物料编码/料号
物料名称
规格型号
单位
实收数量
采购订单号
收货仓库/库位
单价
经手人/备注

为什么手写收货单一直是个录入困局

发票、采购订单这些大多是打印的,印刷体OCR解决得不错。但收货单不一样——它发生在仓库现场,开单人拿着复写纸单据本,在货堆旁匆匆填写。这种场景下产生的三类特殊问题,传统工具至今束手无策。

01 复写纸多联单,字迹逐联衰减

中国工业仓库中,手写入库单几乎都是无碳复写纸做的二联/三联/四联单——第一联(白联)供应商留底,第二联随货同行,第三或第四联才是仓库财务存档。问题在于:复写压力逐联递减,传到最后一联时字迹已经灰淡如铅笔痕。传统OCR在这类低对比度字迹上几乎失效,中文论坛上"It's barely readable to the human eye, let alone a scanner"的抱怨比比皆是。

02 手写编码符号极易混淆,一字之差整行错位

仓管员手写的物料编码通常10-20位字母数字混合——"YQ-2024-A3-01987"、"6B-M12×60"。传统OCR在这些手写字符串上频繁出错:手写"6"看起来像"9",手写"0"和"O"没有区别,手写"1"和"l"同样难以分辨。一个字符认错,整条入库记录的物料就对不上,后续盘点全乱套。

03 收订数量核对全靠眼力和耐心

收货完成后最耗时的一步:拿手写入库单和采购订单逐行比对——供应商送了12箱还是10箱?手写的"12"如果潦草变成了"12"和"10"的模糊地带,没人能确认。仓库通常要两个人交叉核对,一个念、一个勾,这在人手不足的小型工厂就是天天卡脖子的环节。

01 视觉大模型理解整体版面,不依赖像素对比度

简录AI基于视觉大模型(VLM)处理文档——不是逐像素比对字符,而是像人一样"看"整张单据的版面布局和语义内容。即使复写纸第三联的部分手写字迹已经淡至肉眼勉强可读的程度,AI仍能结合字段位置、物料名称的上下文、数字范围的预期值做出合理推断。当然,如果字迹完全不可见,任何AI都无法凭空补全——拍摄时优先用第一联(白联),效果最好。

02 语义上下文纠错,不是孤立的字符匹配

传统OCR把"YQ-2024-A3-01987"拆成15个孤立的字符逐个匹配,手写"6"→"9"就完蛋。视觉大模型读取的是完整物料信息的语义块——编码+名称+规格+数量作为一个整体理解。如果同一行的物料名称是"6mm不锈钢螺栓",AI就知道编码中那个模糊字符是"6"而不是"9"。你用自定义列名同时提取"物料编码"和"物料名称",两个字段相互验证,准确率远高于单字段提取。

03 计算列:提取的同时自动完成收订核验

不需要等数据出来再VLOOKUP。在列名中输入"实收数量"和"订购数量",再加一个计算列"数量差异(实收数量−订购数量)"——AI在提取的同时就帮你算出每行的差值。正数=多送,负数=少送,零=一致。一张表做完,所有收订异常直接标出来,不需要一个念、一个勾的两人交叉核对。

供应商送货到了,手写入库单怎么处理

一天收到5家供应商的收货——每家送来的是复写纸手写入库单,有的字迹清晰,有的是第三联已淡化的灰字。以下是处理闭环。

1

拍照上传全部手写入库单

收到多少张就拍多少张。不管是A供应商的白联(字迹清晰)、B供应商的第三联(字迹已淡),还是C供应商打印后手写填数量的混合单据——一律拖到一起上传。复写纸单据建议优先拍第一联,手机正对单据、光线均匀,效果最佳。不需要分类、不需要把照片另存为PDF。

2

输入一次列名,自动加验算

在列名区输入你需要的字段:供应商名称、入库单号、入库日期、物料编码、物料名称、规格型号、单位、实收数量、采购订单号、收货仓库。如果还需要核对收订数量差异,直接加一个计算列"数量差异(实收数量−订购数量)"——AI在提取时同步完成差值计算,正数代表多送、负数代表少送,一眼看到哪些行需要跟进。

3

下载合并Excel,抽查后导入系统

处理完成后下载一个合并Excel文件。每行对应一张入库单(有多行明细则对应多行),列名与你定义的一致,数量差异列自动填好。手写内容的准确率取决于字迹工整程度——清晰的楷书或行书准确率很高。建议处理完后随机抽查3-5行核对关键编码和数量,尤其是复写纸第三联的单据,确认无误后直接导入ERP或WMS系统。

什么场景适用,什么场景要谨慎

诚实说清楚手写收货单场景下工具的真实边界。

适用场景

  • 中文字迹较为工整的手写收货单——楷书、行书级别的日常手写(不是草书),准确率可以达到较高水平。开单人写得越认真,提取效果越好。
  • 印刷表头+手写内容的混合单据——中国最常见的场景:单据本是印刷的标准格式,现场手写填入物料和数量。AI在同一次读取中同时识别印刷体和手写体,正确关联到同一行。
  • 多供应商、多种手写格式混合批量处理——A供应商用竖版三联单、B供应商用横版二联单、C供应商自己印的格式——同一组列名统一处理,输出Excel列名一致,导入ERP无需再手动统一。

需谨慎的情况

  • 重度草书或龙飞凤舞的连笔字——如果手写内容连有经验的仓管员都要猜三秒才能确认,AI同样会出错。这不是技术问题,是字迹本身的信息保真度已经不足。建议逐步引导供应商和开单人用正楷或清晰行书填写。
  • 复写纸四联单的最后一联,大面积字迹完全不可见——AI无法凭空补全不存在的信息。工具能做的是从可见的部分尽可能提取,不可见字段留空。建议仓库流程上优先接收第一联或第二联作为数字化来源。
  • 此工具提取数据、帮你核对收订差异,但它不管理库存余额——提取完成的Excel需要你自行导入ERP/WMS系统来更新库存。简录AI是做提取和结构化,不是替代仓库管理系统。

常见问题

复写纸入库单最后一联,字迹很淡能识别吗?

可以,但准确率取决于字迹衰减的具体程度。视觉大模型的优势在于它不是逐像素比对字符,而是理解整张单据的版面结构和字段语义——即使复写纸第三联的部分手写字迹已经淡至肉眼勉强可读的程度,AI仍能结合物料名称的上下文、编码格式规律、数量范围的合理预期做出推断。这和人工阅读的原理相似:你看到"实收数量"栏里有个模糊的数字痕迹,结合旁边"物料名称"写的"6mm螺栓",就能推断那个数字不是"60"而是"6"。

但如果字迹完全消失变成空白,任何AI都无法凭空补全——字段会在输出Excel中留空。建议拍摄时优先用第一联(白联),颜色对比度最高,识别效果最稳定。如果只能拿到复写纸多联单中的较淡一联,处理完后对模糊字段做重点抽查就行。

手写物料编码里"6"和"9"、"0"和"O"容易混,AI能正确区分吗?

这就是传统OCR和视觉大模型的核心差异。传统OCR把物料编码"YQ-2024-6B"拆成12个孤立字符逐个比对,手写"6"→"9"就是不可逆的错误。视觉大模型读取的是整行物料信息的语义块——编码、名称、规格、数量作为一个整体理解。如果你同时提取"物料编码"和"物料名称",当编码中的某个手写字符模糊时,AI可以交叉参照同行的物料名称(如"6mm不锈钢螺栓")来推断编码中那个模糊字符是"6"而不是"9"。

一个实用建议:列名中同时包含"物料编码"和"物料名称"——两个字段相互验证,比单字段提取准确率高得多。对于完全孤立、没有任何上下文线索的手写编码(如系统外临时编的号),建议处理完后人工抽查确认。

仓管员现场匆忙写的潦草字迹,准确率怎么样?

视觉大模型能处理一定程度的潦草手写,但效果与字迹的规范程度直接相关。清晰的楷书和工整的行书准确率很高;轻度潦草(笔画有简化但结构可辨识)也能处理,部分字段可能需要抽查;重度草书或涂抹改写——连有经验的仓管员都要猜几秒才能确认——AI的准确率会明显下降。

这不是技术局限,而是信息本身已经退化:如果人类专家都无法从字迹中确定读出信息,AI当然也不行。如果仓库长期面临供应商开单潦草的问题,建议逐步推行"开单正楷化"——这不仅是自动化工具的需要,也是仓库管理规范化的基本要求。半印刷半手写的混合单据(表头印刷、手写填入)的准确率高于全手写单据。

如何自动比对手写收货数量和采购订单数量?

通过计算列功能,在提取手写入库单数据的同时自动完成收订核验。你只需要在列名中分别输入"实收数量"和"订购数量",再加一列"数量差异(实收数量−订购数量)"——AI提取时同步执行减法运算,结果直接填入差异列:正数代表供应商多送了,负数代表少送了,零代表完全一致。

这种方式比传统的"先提取完整Excel再用VLOOKUP匹配PO表然后手动减"省了两个步骤。需要注意的是,计算列的准确性取决于"实收数量"和"订购数量"两个源字段的识别准确率——如果源字段读错了,计算结果也跟着错。所以仍然建议对差异不为零的行抽查原始单据。计算列有两种写法:列名写法(无需登录,demo可直接体验,如"数量差异(实收−订购)")和Rule Format(登录用户,适合更复杂的多步推导)。

不同供应商的手写入库单格式不一样,需要逐个配模板吗?

不需要。这正是自定义列名提取的核心价值——你不需要为每家供应商画框、设坐标、配模板。你只需输入一次目标列名,如"供应商名称、入库单号、物料编码、实收数量、批次号",AI根据字段语义含义在每张手写入库单上分别找值——不管A供应商用的是竖版三联单、B供应商用的是横版二联单,还是C供应商自己打印的格式。输出Excel的列名就是你定义的,所有供应商数据合并到同一套表结构中。

延伸阅读:AI手写识别全指南:从潦草笔记到结构化数据——为什么传统OCR认不了手写,视觉大模型如何做到人类级别的手写理解。 仓库收货单批量录入到Excel——出入库单据的批量处理方案,含入库单、送货单混合场景完整闭环。 AI如何读懂手写表单:勾选框与填写项的识别机制——视觉大模型对手写表单的结构理解原理。