VLM 驱动 AI OCR

工资条转Excel — 薪酬数据批量提取与汇总

手工录入一张工资条到Excel平均耗时3分钟——且每家公司的薪资格式各不相同。5-10秒提取一张,应发/实发工资、五险一金、个税自动填列,无需逐格定位。

文件不用于模型训练 · TLS 1.3 传输加密

PDF工资条
纸质扫描
XLSX/CSV
实发校验

工资条可提取哪些字段

输入你需要的列名——AI通过理解每个数字的含义和文档位置(收入区、扣款区、汇总区),自动从任意公司格式的工资条中定位对应值,而非按坐标框选。

员工信息与薪资期间

员工姓名
公司名称
工号
薪资期间起
薪资期间止
发放日期

收入、扣款与汇总

基本工资
岗位工资
绩效奖金
加班工资
各项补贴
应发工资
养老保险
医疗保险
失业保险
住房公积金
个人所得税
其他扣款
实发工资
企业年金
专项附加扣除

以上仅为常见字段示例——你的工资条上有任何字段,直接写列名即可,AI会根据你的定义去文档中查找对应数据。不是固定模板。

为什么工资条比普通表格更难提取——每一张都是一个独立的小型财务报表

一张工资条不是平面清单——它同时包含收入区(应发)、扣款区(五险一金+个税+其他)、汇总区(实发),三层数据之间存在"应发−各项扣款=实发"的计算链路。模板式OCR和人工录入手写都在这条链路上断裂。

为什么传统方法在这里失效

01 应发工资和实发工资同时出现在一张纸上——且中间隔着五险一金和个税

每张工资条都有应发总额和实发到手金额,两者之间是养老保险(个人8%)、医疗保险(个人2%)、失业保险、住房公积金、个人所得税等多层扣款。手动录入时HR必须逐项核对"应发−各项扣款=实发"这个等式是否成立——遇到扣款项目多的工资条(企业年金、补充公积金、专项附加扣除),核对时间比录入时间还长。模板式OCR工具只按坐标找"金额"列,无法区分"应发合计"和"实发合计"在文档中的不同位置,经常把两个数字混填。

02 每家公司工资条格式不同——用友、金蝶、企业微信的排版完全不一样

用友薪资系统导出的工资条通常是密集的横向表格,收入项和扣款项并排显示。金蝶的格式喜欢把收入、扣款、汇总分成上下三块。企业微信工资条是卡片式布局,每个字段一行。中小公司自己用Excel做的工资条干脆没有固定版式——字段名可能叫"税前合计""应发金额""本月应付"或直接写"Total"。固定坐标的OCR模板工具需要为每种格式单独画框——HR管理三家子公司用三种薪资系统,就得维护三套模板,任何一次格式更新都要重新画框。

03 纸质工资条拍照、扫描件、手机截图——图像质量差异极大

虽然越来越多的公司改用电子工资条,但大量中小企业和工厂仍然使用纸质工资条(针式打印机复写纸、热敏小条、打印裁剪)。这些纸质工资条在拍照或扫描时面临拍照角度歪斜、光线不均、复写纸字迹模糊等问题。传统OCR对这类低质量图像的识别准确率大幅下降,尤其是小字号的数字(如社保个人缴纳金额通常用8号字)更容易识别错误。知乎和贴吧上有大量HR反映"每个月裁工资条、录工资表就要花一整天"——大量时间其实花在了纸质工资条的数字化环节。

自定义列名提取如何解决这些问题

01 应发和实发自动提取到不同列——AI理解的是字段含义,不是像素坐标

当你定义"应发工资"和"实发工资"两个列名时,AI读取文档时会根据上下文判断每个数字属于哪个区——收入区的合计是应发,扣款区之后的总计是实发。它不依赖数字在页面上的位置坐标,而是理解"这个数字前面是各项收入明细所以它是应发""这个数字在扣款清单之后所以它是实发"。输出结果中应发和实发分别在独立的列中,互不干扰。同理,"养老保险""住房公积金""个人所得税"也各自准确填列到对应的列。

02 语义匹配跨平台——同一组列名适用于用友、金蝶、企业微信以及任何自制格式

简录AI的核心机制是自定义列名提取——你输入希望提取的字段名(如"员工姓名""应发工资""养老保险""实发工资"),AI通过理解文档的语义来定位每个值。不管工资条上的标签叫"税前合计"还是"应发金额"还是"本月应付",AI都能识别它们对应的是同一个概念——应发工资。同一组列名定义可以一次配置、跨所有公司和所有薪资系统使用。HR管理多个子公司或为多家客户代发薪时,不需要为每个客户维护一套独立的提取规则。格式更新或更换薪资系统后也不需要重新配置。

03 计算列自动验证实发金额——提取的同时完成核对

添加一个计算列——即在列名中直接描述计算逻辑,AI提取数据时同步完成运算。写"实发验证(应发工资−养老保险−医疗保险−失业保险−住房公积金−个人所得税)",AI在提取工资条数据的同时算出预期实发金额,并与工资条上打印的实发工资对比输出。任何差异——少扣了一项社保、个税计算有误、手动录入时抄错了数字——都会在Excel结果中立即暴露,无需事后逐行核对。对于需要跨表引用固定参数的计算(如核对社保缴费基数上下限),登录后可以使用Rule Format定义JSON规则,执行更复杂的多步验证。

从多份工资条到一张薪酬汇总表:实际操作流程

如果你需要定期处理工资条——例如代账公司为客户做薪资核算、集团HR汇总各子公司薪资、或审计抽查历史工资数据——以下是完整的操作闭环。

1

上传工资条——任意格式、任意人数,一张或多张批量上传

拖入从用友、金蝶导出的PDF工资条、手机拍下的纸质工资条照片、企业微信截图,或扫描的复写纸工资表。支持JPG、PNG、WebP和PDF格式。如果你需要处理50名员工的工资条,直接全部上传——批量处理会将所有文件合并到一个任务中处理,输出一张统一的Excel汇总表。如果工资条需要从员工手里收集——生成一个收集链接:员工用手机打开链接、输入验证码即可上传自己的工资条,无需注册账号,文件自动进入你的待处理队列。

2

输入列名,一次配置多次复用

写下你要提取的字段:"员工姓名""工号""薪资期间起""薪资期间止""应发工资""养老保险""医疗保险""失业保险""住房公积金""个人所得税""实发工资"。添加一个计算列"实发验证(应发−养老−医疗−失业−公积金−个税)"在提取时同步验证。还可以用推断列——如"薪资周期(选项:月薪/双周薪)",AI根据工资条上的期间信息自动判断并归类。同一组列名配置适用于本次上传的所有工资条——不管来自哪家公司、哪种薪资系统。登录后可以保存为模板,下次直接调用,无需重新输入。

3

下载汇总Excel,自带实发验证

每张工资条对应Excel中的一行。30张工资条产生30行数据,每行包含你要求的所有字段——应发、各项扣款、实发以及实发验证结果,列名与你定义的完全一致。计算列"实发验证"紧邻"实发工资"列,差异一目了然——有差异的行说明工资条计算可能有误或录入时遗漏了某项扣款。导出XLSX或CSV后可直接用于个税申报比对、年度薪酬分析,或导入用友、金蝶、QuickBooks等财务系统。对于每月固定处理的薪资对账任务,登录后保存列名模板,每月复用即可。

什么情况下效果最好——什么情况下需要留意

效果最好的场景

薪资系统直接导出的电子工资条。从用友、金蝶、薪人薪事、企业微信等系统导出的PDF或截图,AI直接读取清晰的数字文字,并根据薪资特有的分区布局(收入区、扣款区、汇总区)理解字段含义。员工信息、所有收入项、五险一金分项、个税、实发工资均可稳定提取。

多公司多员工的批量薪资汇总。一次性上传不同公司、不同员工、不同薪资系统的工资条,同一套列名定义全部处理,输出一张统一的汇总表——代账公司处理多家客户薪资、集团HR汇总跨子公司薪酬数据的典型场景。

实发工资的自动验证。用计算列在提取时同步验证应发→实发的计算链路。添加一列验证列——差异会直接显示在输出中,在数据进入薪酬报表或个税申报之前就发现问题。

需要留意的场景

拍照质量差的纸质工资条。纸质工资条拍照或扫描时,如果出现严重的歪斜、光线不均、字迹模糊(尤其是针式打印机复写纸的低对比度文字),识别准确率会下降。建议用扫描仪以200dpi以上分辨率扫描,或用手机在均匀光线下正对拍摄。批量处理大量纸质历史档案前,先抽几张验证效果。

非标准扣款项目或罕见薪资构成。常规的五险一金、个税、基本补贴提取稳定。但如果工资条上有特殊扣款——如法院强制执行扣款、股权激励行权、税前扣除的延缴年金等非标项目——AI会尝试按语境识别,但建议首次处理时做人工抽查,确认字段映射正确后再批量处理同一家公司的后续月份。

多页工资条(如含年终奖分页或补充养老金明细)。某些企业系统(如SAP SuccessFactors、Workday中文版)生成的工资条可能分多页——第一页是月度薪资,第二页是年终奖或企业年金明细。AI会分别提取各页内容,但输出列数会相应增加。首次处理时确认字段映射,再批量处理。

常见问题

能区分工资条上的应发工资和实发工资吗?

能。工资条同时包含应发工资(税前各项收入合计)和实发工资(扣除五险一金及个税后的到手金额),简录AI通过理解文档上下文自动区分——收入区的合计是应发,扣款区末端的总计是实发。你只需分别定义"应发工资"和"实发工资"两个列名,AI会将正确的金额填入对应的列,不会把两者混淆。这是模板式OCR工具最常见的痛点:它们按坐标找"合计"行,无法区分应发和实发所在的上下文。

支持哪些公司的工资条格式?用友、金蝶、企业微信的都行吗?

都行。简录AI不依赖坐标模板——它通过语义理解来定位字段,不是按固定位置框选。无论你用友导出的横向表格、金蝶的上下分区布局、企业微信的卡片式工资条、薪人薪事/蚂蚁工资条等平台格式,还是Excel自制打印的工资表、纸质工资条拍照,同一组列名("员工姓名""应发工资""养老保险""实发工资")可以跨所有格式使用。遇到全新的工资条布局时,建议首次提取后花两分钟核对字段映射,确认无误后即可批量处理后续所有同格式的工资条。更换薪资系统后也不需要重新配置。

五险一金和个税能分开提取吗?

能分别提取。为养老保险、医疗保险、失业保险、住房公积金、个人所得税各自定义独立的列名,AI会理解每个数字对应的扣款类别——即使不同公司对同一扣款的标签不同(如"养老保险"在某些工资条上标为"养老""基本养老""养老金个人扣款"),AI通过语义匹配统一映射到正确的列。输出结果中每个扣款项目独占一列,方便你按月汇总社保费用或核对个税申报数据。如果需要按城市核对社保缴费基数,可以利用计算列引用当地基数标准进行自动验证。

怎么验证工资条上实发工资的计算是否正确?

使用计算列——在列名中直接写计算逻辑,AI提取时同步运算。添加一列"实发验证(应发工资−养老保险−医疗保险−失业保险−住房公积金−个人所得税)",AI会在提取的同时计算预期实发金额,并与工资条上打印的实发工资对比输出。任何差异(少扣了社保、个税算错、手动录入抄错数字)都会立刻在Excel中暴露。这个功能不是替代薪资计算系统,而是在数据进入你的薪酬报表或个税申报表之前提供一道自动校验——让你在错误进入下游系统之前发现它。复杂的多步验证逻辑可以通过登录后的Rule Format以JSON规则定义。

可以把不同公司员工的工资条批量汇到一张表吗?

可以。一次上传来自多家公司、不同员工、不同薪资格式的工资条,输入一次列名,所有工资条统一提取到相同的列,输出一张合并Excel表——每行一位员工。这对代账公司、集团HR和薪资外包服务商尤其有用:每月处理多家客户薪资时,只需维护一套列名模板,每次复用即可。如果需要从员工或客户那里收集工资条,生成收集链接(Collection Link):一个可分享的URL,接收方打开后输入验证码即可上传工资条到你的处理队列,无需注册。文件集中后统一批量提取。