视觉大模型驱动 AI OCR

完税证明转Excel
纳税记录一键提取,个税企业所得税批量汇总

手工将一张完税证明的纳税人识别号、税种、税款所属期、实缴金额逐项录入Excel,平均耗时3分钟——简录AI处理每张仅需5到10秒。个人所得税完税证明和企业所得税完税证明混合上传,2019年前后格式自动兼容,批量输出统一汇总表。

文件不用于模型训练 · TLS 1.3 传输加密 · 处理后自动删除

完税证明PDF/截图
纳税记录(2019年后)
XLSX/CSV

完税证明上能提取哪些税务信息

输入你需要的列名——"纳税人识别号""税种""实缴金额""税款所属期"——简录AI根据列名的语义在完税证明中定位对应数据。你输入的列名就是最终Excel的表头。不按坐标框选、不按版式模板匹配,视觉大模型理解的是画面内容——无论老版完税证明还是新版纳税记录。

纳税人识别号
纳税人名称
填发日期
税务机关
票据号码
税种
品目名称
税款所属时期
实缴金额
合计金额(大写)
合计金额(小写)
入(退)库日期

以上为完税证明常见提取字段。你还可以自由添加证明上任意其他信息——原凭证号、填票人、备注栏、验证码等,AI均可按需提取。需要自动验证金额一致性或区分税种大类?看看下面的计算列和推断列

完税证明的提取难度不在"识别文字",而在一份证明里有多种税、多个字段、多种格式

腾讯云、阿里云、百度的OCR平台都能"读出"完税证明上的文字,返回固定字段的JSON。但你真正需要的不是一次API调用和一段JSON——你需要的是把多份完税证明的纳税人识别号、税种、实缴金额、税款所属期变成一张对齐的Excel,不管一份证明里有1条缴款明细还是50条明细,不管它是老版完税证明还是新版纳税记录。在知乎上,有财务人员讨论"人工录入发票和凭证信息太痛苦了,有没有快速解决的软件?"——回复区反映的真实困境是:工具能识别的字段有限,剩下的还是要自己手打。

传统方案的问题

01

固定字段清单——需要的字段不在列表里

各大OCR平台的完税证明识别API返回10到15个固定字段:纳税人识别号、纳税人名称、填发日期、合计金额等。但如果HR处理员工个税证明时需要区分"税款所属期起"和"税款所属期止"两个日期,或者财务归档时需要单独提取"原凭证号"用来追溯,这些字段不在固定清单里——你用不了OCR API之后,还是要对着原图手打,工具并没有真正让工作量归零。

02

多行缴款明细——行数不固定,输出结果难以统一

一份完税证明里可能只有1条缴款记录(单一税种单次缴纳),也可能包含几十条明细记录——不同税种(个人所得税、增值税、企业所得税、房产税、印花税等)、不同品目、不同税款所属期混合在一起。传统OCR API输出的JSON中,明细是一个数组——行数不固定,输出格式难以直接填入固定列宽的Excel。你还得写代码或手工把数组展开成行。

03

2019年格式改革——老版完税证明和新版纳税记录不兼容

自2019年1月1日起,个人所得税的缴税证明从《税收完税证明》(文书式)调整为《个人所得税纳税记录》——两者版面布局完全不同。老版完税证明以表格展示税种、品目、所属期和实缴金额;新版纳税记录以列表形式展示收入、已缴税额和入退库日期。如果你同时处理员工2018年和2023年的缴税记录,两种格式混在一起,传统模板匹配的OCR工具无法同时兼顾——要么分两批处理,要么手动调整。

简录AI的解法

01

自定义列名提取——你要什么字段,就输入什么列名

没有固定字段清单。你在输入框中写下需要的列名——"纳税人识别号""纳税人名称""税种""品目名称""税款所属时期起""税款所属时期止""实缴金额""原凭证号""票据号码"——AI根据列名的语义在每份完税证明中定位对应的值。传统OCR不返回的字段(如备注栏内的合同编号、原凭证号),只要证明上有,AI就能找到。你输入的列名就是最终Excel的表头。

02

多税种、多明细、多格式——全部混合上传,一张表输出

个人所得税、企业所得税、增值税、房产税、印花税——不管一份证明里有1种税还是5种税、1条明细还是50条明细,每条缴款记录都会被独立提取为一行。2019年前的老版完税证明和2019年后的新版纳税记录、表格式和文书式、PDF扫描件和手机拍的照片——全部可以放进同一个批次混合上传。输出Excel中所有字段自动对齐,不需要因为格式不同就拆成两张表。

03

计算列验证金额一致性 + 推断列自动分类

完税证明上合计金额同时列有大写(如"壹佰贰拾叁万肆仟伍佰陆拾柒元捌角玖分")和小写(1234567.89),传统OCR只返回其中一个版本——你无法做交叉验证。计算列可以让你定义验证规则:输入金额验证(IF(合计金额小写=小写值, "一致", "需复核")),AI提取时自动完成比对。

推断列则能让AI自动分类。例如输入税种大类(选项:个税/增值税/企业所得税/其他),AI会根据税种名称自动判断归属类别——即使完税证明上没有"税种大类"这个字段。

HR处理30位员工的个税完税证明——2019年前后格式混杂,一次性批量汇总

这不是虚构场景。许多企业的HR部门在员工办理房贷、出国签证或申请落户时需要提供个人完税证明——有的员工提供的是2018年的老版完税证明(文书式),有的是2023年的新版纳税记录(表格式),格式完全不同。以下是简录AI的实际处理流程。

1

收集所有员工的完税证明文件

将30位员工的完税证明拖入上传区——可能是个人所得税APP导出的PDF、电子税务局下载的扫描件、手机拍的照片——格式不限、年份不限、版式不限。也可以使用收集链接让员工自己上传:生成专属链接发给员工,对方点击后拍照上传个税证明,文件自动进入你的处理队列,无需对方注册。

2

输入列名,定义提取和验证规则

在列名输入框中填写需要的字段——"纳税人识别号""纳税人名称""税种""品目名称""税款所属时期""实缴金额""合计金额(大写)""合计金额(小写)""填发日期""税务机关"。再加两个计算列:金额校验(IF(合计金额小写=期望值, "OK", "复核"))税款年份(YEAR(税款所属时期结束))——AI在提取每条明细时自动验证金额一致性和标注所属年份。

3

导出汇总Excel,直接用于HR存档和工资核算

处理完成后下载一份XLSX文件:所有员工的每条缴款明细各占一行,字段整齐对齐。计算列的验证结果自动标注——"金额校验"列为"I"的行即大写字面金额与小写不一致,需要人工复核。老版完税证明和新版纳税记录的输出列完全一致,不需要两套表头、两套模板。这张表可以直接作为HR部门个税档案的底稿,或导入企业薪酬系统做税前扣除核对。

适用场景与注意事项

不写"什么都能做"。以下是真实的能力边界——知道什么情况下效果好、什么情况下需要谨慎,比一份夸大的功能清单更有用。

效果最佳的场景

✓ 电子税务局或个税APP导出的PDF格式完税证明

电子税务局和个税APP生成的完税证明为PDF格式,文字清晰、排版规范、无纸质扫描产生的噪点和变形——这是最佳输入类型。印刷体文字识别准确率最高可达99%,纳税人识别号、税额等核心字段尤其精准。

✓ 批量处理员工或子公司的完税证明,统一汇总成台账

HR部门收集员工个税证明(用于房贷、落户、签证等)、企业财务部门归档各子公司或分支机构的完税证明——几十份甚至上百份混合上传,直接输出一张汇总Excel,完全省去了逐份录入×逐条核对的中间环节。

✓ 需要提取固定清单之外的字段,或做金额交叉验证

传统OCR API返回固定字段——如果你需要提取"原凭证号"用于税务稽查追溯、"备注栏"内的专项信息用于内部核算、或者同时提取大写和小写金额做交叉验证——列名提取机制正是为这类需求设计的。

需要留意的场景

⚠ 严重模糊、反光、透视变形的纸质扫描件或照片

纸质完税证明翻拍的照片容易出现反光(特别是塑封过的证明)、斜拍导致的透视变形、或光线不足导致的模糊。这类图像的文字区域可能被误读——尤其是18位纳税人识别号,一个字符的错误就需要到电子税务局手动核查。建议尽量使用电子版PDF或确保拍摄光线均匀、正对取景。

⚠ 个税APP导出的纳税记录PDF需要密码打开(身份证后6位),提供加密PDF前请先解除密码

个人所得税APP导出的纳税记录PDF默认有打开密码(密码为身份证后6位,含字母需大写)。简录AI需要读取明文PDF内容——请先使用密码打开PDF后另存为无密码版本再上传,或直接使用PDF打印功能输出为新的未加密PDF。加密PDF本身无法直接提取文字。

⚠ 完税证明真伪验证不在本工具范围内

简录AI负责从完税证明图片或PDF中提取文字信息——纳税人识别号、税种、金额等。但这不等同于完税证明的真伪核验。个人所得税纳税记录可通过自然人电子税务局的"票证查验"功能扫描右上角二维码验证,或登录电子税务局进行查询。本工具不连接税务系统做真伪比对。

常见问题

2019年前后的完税证明格式不同(老版完税证明和新版纳税记录),能混合处理吗?

可以混合处理,不需要先分类。2018年12月31日及以前开具的是《税收完税证明》(分表格式和文书式两种样式),版面包含税种、品目名称、税款所属时期、实缴金额等明细表格;2019年1月1日及以后开具的是《个人所得税纳税记录》,版面以列表形式展示收入、已缴税额和入退库日期——两者的信息结构完全不同。

简录AI的视觉大模型不依赖版式模板——它通过理解画面内容来定位字段,而非依赖"税种在第几行第几列"的固定坐标。老版完税证明和新版纳税记录可以放在同一个批次中上传,AI会自动识别每份文件的类型并按各自逻辑提取——输出到同一张Excel表中,字段完全对齐。不存在"老版一张表,新版一张表"的问题。

一份完税证明里有多个税种的缴款明细,比如个税、企业所得税、增值税混在一起,能区分并分别提取吗?

可以,而且这正是简录AI区别于传统OCR API的核心能力。一份完税证明的纳税明细区可能列出多种税种——例如同一份证明中既有"个人所得税-工资薪金所得"又有"增值税"和"企业所得税"。每条缴款明细会被独立提取为Excel中的一行数据,包含税种、品目名称、税款所属时期、实缴金额等完整字段。

如果你需要按税种分类汇总,可以定义推断列:例如输入 税种大类(选项:个税/增值税/企业所得税/房产税/印花税/其他),AI会根据税种名称自动判断归属类别——即使完税证明上没有"税种大类"这个字段。所有缴款明细完整保留,不会因为行数多就被截断只取前几行。

合计金额同时有大写(如"壹佰贰拾叁万肆仟伍佰陆拾柒元捌角玖分")和小写数字,能同时提取并自动验证是否一致吗?

可以。完税证明的合计金额通常会同时列出大写和小写两个版本——大写用于防伪和正式归档,小写用于财务计算。提取时你可以分别定义"合计金额(大写)"和"合计金额(小写)"两个列名,AI会将两种格式都提取出来。

为了保证数据不出错,建议使用计算列做自动验证。虽然大写金额转小写的模板计算在列名层面有限制,但你可以定义一个简单的比对列:输入 金额比对状态(IF(合计金额大写≠"", "已有大写记录,需人工核对", "正常"))。凡是同时提取到大写和小写的行,处理完成后建议人工抽查确认金额一致性——税务数据的严谨性不容出错。

个税APP导出的纳税记录PDF有打开密码(身份证后6位),能直接上传处理吗?

不能,加密PDF需要先解除密码。个人所得税APP导出的纳税记录PDF默认设有打开密码——密码为纳税人身份证后6位(不足6位的前面补0,若最后一位为字母需大写)。简录AI无法读取加密PDF中的文字内容。

解决方法很简单:用密码打开PDF后,选择"另存为"(不要勾选加密选项)或者直接用PDF阅读器的"打印"功能,打印机选择"另存为PDF",即可生成一份无密码的新文件——内容完全一致,但不再加密。上传这份无密码版本即可正常处理。

导出的Excel能不能直接对接企业的薪酬系统或个税申报台账?税款所属期会不会变成乱码日期格式?

简录AI导出的XLSX文件是标准Excel格式,列名完全由你自定义——你可以将列名设置为与企业内部薪酬系统或个税台账要求的字段名完全一致。例如系统要求导入模板的列名为"纳税人识别号""税款所属期起""税款所属期止""实缴税额"——你就在简录AI中输入这些精确的列名,导出的Excel可以直接作为导入文件。

关于日期格式:完税证明上的税款所属期通常以"2023-01-01至2023-12-31"或"2023年1月至2023年12月"的形式出现。简录AI支持智能数据后处理——你可以定义日期列输出为YYYY-MM-DD格式,系统会自动标准化清洗。纳税人识别号中的空格也会自动去除、金额列统一为数字格式,导出前就已完成标准化,数据可以直接进入系统。

了解更多:财务流程自动化实战指南 —— 从发票到完税证明,财务文档批量处理的完整方案 · 从任意文档中提取指定字段 —— 自定义列名提取机制的深度介绍 · 人工录入Excel的隐性成本 —— 为什么手动录入比你以为的更贵