增值税发票转Excel
发票代码到税额,一键全字段提取
手工将一张增值税发票的发票代码、号码、货物明细、税率、税额逐项敲进Excel,平均耗时3分钟——用简录AI只需5到10秒,专票和普票混合上传,批量输出同一张汇总表。
文件不用于模型训练 · TLS 1.3 传输加密 · 处理后自动删除
增值税发票上能提取哪些字段
输入你需要的列名——发票代码、货物名称、税额——简录AI根据列名的语义在发票中定位对应数据。你输入的列名就是最终Excel的表头。不是按坐标框选,不是按模板匹配,而是理解发票内容后找到正确的值。
以上为增值税发票常见提取字段。你还可以输入发票上任意其他信息——销售方地址、备注栏、收款人、复核人、密码区内容等,AI均可按需提取。需要提取发票上没有的信息?看看下面的推断列。
增值税发票的提取难点不在"识别文字",而在理解发票的业务逻辑
如果你用过百度OCR或阿里云OCR的发票识别API,会发现它们能"读"出文字,但你真正需要的是"理解"这张发票——知道专票要价税分离、知道同一张票上不同货物可能适用不同税率、知道货物明细的行数每张都不一样。这就是传统OCR API 和 AI 提取之间的差距。
传统方案的问题
固定字段清单,需要什么反而提不到
百度OCR返回30个字段、阿里云返回20多个、腾讯云返回30多个——但如果你需要提取供应商"开户行及账号"用于ERP录入,或者需要区分"复核人"和"收款人",多数API的固定字段清单里没有。你想提的正好不在列表里。在知乎上, 有财务人员问"人工录入发票信息真的好烦,有什么软件可以快速解决这个问题吗?"——底下回复里提到,许多公司财务团队每周光在发票录入上就浪费20-30小时,因为工具只能提固定字段,剩下的还是要手工补。
专票和普票格式不同,但没人帮你区分
专票必须价税分离——金额、税率、税额各占一列,且满足"金额×税率=税额"的勾稽关系。普票则只输出一个合计金额。如果你的供应商池里专票和普票都有,用传统OCR工具你需要自己判断每张发票的类型、再手动调整Excel表头——因为两种票的输出结构不一致。
货物明细行数不固定,输出表格难以统一
一张发票可能只有1行货物("办公用品一批"),也可能有几十行货物(不同规格型号、不同税率)。传统OCR工具按固定模板输出,行数不固定的货物明细要么被截断(只取前N行),要么输出格式与固定列宽的Excel表不匹配。月底汇总几十张发票时,手工合并货物明细是财务人员的噩梦。
简录AI的解法
自定义列名提取——你定义列名,AI找数据
没有固定字段清单。你在输入框中写上想要的列名——"发票代码""开户行及账号""复核人""收款人"——AI根据列名的语义在每张发票中定位对应的值。你输入的列名就是最终Excel的表头。不管百度OCR有没有这个字段、不管阿里云API返不返回这项数据,只要发票上有,AI就能找到。
专票普票混合上传,输出统一的Excel结构
你把专票、普票、电子发票全部上传到同一个批次,AI自动识别每张发票的类型,按专票的逻辑提取价税分离字段,按普票的逻辑提取合计金额,但输出到同一张Excel表中——表头统一,字段一致。不会因为混了两种发票就得开两张表。
计算列自动验证勾稽关系,同时支持推断列
你可以在列名中定义计算逻辑:例如输入 勾稽差异(税额 - 金额×税率),AI在提取时自动完成运算,输出差值——不为零即说明数据有误,无需手工逐行验证。还可以定义推断列——如输入 费用类别(选项:采购/办公/差旅/其他),AI会根据货物名称和销售方信息自动判断费用类别,即使发票上没有"费用类别"这个字段。
月底收到30张供应商发票,15张专票、10张普票、5张电子发票——怎么处理
不是虚构场景。这是中国中小企业财务每月的真实状态——不同供应商用不同开票系统、不同发票类型混在一起。以下是简录AI的实际处理流程。
上传混合发票文件
将30张发票全部拖入上传区——PDF扫描件、OFD格式电子发票、手机拍的照片——格式任意、类型任意、大小任意。也可以使用收集链接分享给供应商或同事,让他们直接上传发票到你的处理队列,无需对方注册。
输入列名,定义提取需求
在列名输入框中填写你要的字段——"发票代码""发票号码""开票日期""供应方名称""货物名称""金额""税率""税额""价税合计""发票类型"。再加一个计算列税额验证(税额 - 金额×税率)——AI读取每张发票时同时做算术,凡是验证结果不为零的行,就是需要人工复核的异常数据。
导出汇总Excel,直接入账
处理完成后,导出为一个XLSX文件:每张发票的每行货物明细占一行,专票的价税分离字段和普票的合计金额字段统一输出,计算列的验证结果自动呈现。这张表可以直接导入用友/金蝶/ERP系统,或者作为月底进项税抵扣的底稿。不再是30张发票×逐行手工录入×逐张验证正确性。
适用场景与注意事项
不写"什么都能做"。以下是真实的能力边界——知道什么情况下效果好、什么情况下需要谨慎,比一份夸大的功能清单更有用。
效果最佳的场景
✓ 印刷体发票,清晰度高
电子发票PDF/OFD、清晰扫描件、光线均匀的手机拍照——印刷体文字识别准确率最高可达99%。发票关键字段(发票代码、号码、金额、税额)准确率尤其高。
✓ 专票、普票、电子发票混合处理
三种发票类型可以混合上传到同一批次。AI自动识别每张发票的类型并分别按对应逻辑提取,输出Excel表头统一。
✓ 需要提取固定清单之外的字段
传统的发票OCR工具只能返回预设字段。如果你需要提取"开户行及账号""复核人""备注栏里的合同号"等非标准字段,列名提取机制正是为此设计的。
需要留意的场景
⚠ 模糊、反光、严重透视变形的发票照片
照片质量直接影响识别准确率。模糊发虚、强反光遮盖了文字区域、或斜拍导致严重透视变形的发票,文字可能被误读。建议用扫描App或保证光线均匀、正对拍摄。
⚠ 手写发票或手写修改过的发票
印刷体文字识别准确率高,但手写字迹(尤其是潦草的手写备注、手写补充的货物名称)准确率低于印刷体。关键字段(金额、税额)如为手写,建议人工复核。
⚠ 发票验真不在本工具范围内
简录AI提取发票上的文字信息,但不连接国家税务总局查验平台做真伪验证。发票验真需要单独登录全国增值税发票查验平台,输入发票代码、号码、开票日期和校验码进行核验。
常见问题
增值税专用发票和普通发票的提取有什么区别?专票的价税分离能正确处理吗?
专票和普票的核心区别在于专票需要价税分离——"金额(不含税)"、"税率"、"税额"、"价税合计"四个字段各自独立,且满足"金额×税率=税额"的勾稽关系。简录AI在提取专票时,会分别输出这四个独立列,你可以通过计算列功能(在列名中写税额验证(税额-金额×税率))自动验证勾稽关系——任何非零行都需要人工复核。
普票不分离价税,发票面额即是价税合计。简录AI提取普票时直接输出合计金额。专票、普票可以混合上传,AI自动识别每张发票的类型并分别按正确逻辑处理,输出到同一张Excel——表头统一、字段一致。
一张发票上有多种税率的货物,比如13%和9%混在同一张票上,能正确提取吗?
可以,这正是简录AI区别于传统OCR工具的核心能力之一。每行货物明细会被独立提取为一行数据,包含货物名称、规格型号、数量、单价、金额、税率、税额等完整字段。一张发票上有13%和9%两种税率的不同货物,输出Excel中会有两行(或更多),每行各自带正确的税率和税额。
如果你还需要跨行汇总,可以用计算列对不同发票做合计——例如输入13%税率货物合计税额或直接在列名中写汇总逻辑。这比手工逐行分类汇总快得多。
电子发票OFD格式能识别吗?全电发票(数电发票)支持吗?
支持OFD格式。OFD(Open Fixed-layout Document)是中国电子发票的国家标准版式文件,国家税务总局自2020年起推广使用。简录AI可直接读取OFD文件中的发票版面信息进行结构化提取——不需要先转成PDF或图片再识别。
全电发票(数电发票,即"全面数字化的电子发票")同样支持。数电发票自2024年12月起全国推广,以XML或OFD格式交付。无论是传统的增值税电子发票(带发票专用章),还是新版数电发票(无发票专用章),简录AI都能识别提取。
提取出的税额和金额准吗?有没有办法验证勾稽关系?
印刷体增值税发票的金额、税额、发票代码、发票号码等关键字段的识别准确率最高可达99%。但财务数据的严谨性要求万无一失——因此简录AI提供了计算列机制来做自动验证。
具体做法:在列名中定义一个计算列——勾稽差异(税额 - 金额×税率)——处理完成后,这一列的值就是每行数据的验证结果。若某行输出"0",说明金额、税率、税额三者完全匹配;若输出非零值,说明该行数据需要人工复核。你不需要逐行用计算器验证,看一眼"勾稽差异"列即可锁定异常。
提取出的Excel能不能直接导入用友/金蝶等财务软件?
简录AI导出的XLSX文件是标准Excel格式,列名由你定义——你可以将列名设置为与用友凭证导入模板、金蝶凭证导入模板或你所用ERP系统要求的字段名称完全一致。导出后直接作为导入文件使用,无需二次调整表头。
此外,简录AI支持智能数据后处理:可以自动将日期格式统一为YYYY-MM-DD、将金额格式统一为保留两位小数的数字格式、将纳税人识别号中的空格自动去除——这些标准化清洗在导出前就已完成,导出的数据可直接导入财务系统,省去打开Excel再做格式调整的步骤。
了解更多:不同发票格式统一处理方案 —— 详解专票、普票、电子发票、OFD格式的混合处理机制 · 批量发票数据提取到Excel —— 大批量发票月底汇总的完整工作流 · 自动提取发票任意字段 —— 自定义列名提取机制的深度介绍