金税四期下电子发票归档合规指南:
企业必须知道的规则与实操路径
2025年是金税四期建成的目标年份,数电票(全面数字化电子发票)已覆盖全国98%的用票企业。但国家税务总局在推广过程中发现了一个普遍问题:大量企业仍然只保存电子发票的纸质打印件,把"打印出来贴在报销单后面"当成归档——这在金税四期以数治税的体系下,已经不是"不规范",而是不合规。
财政部的数据更直接:据国家档案局对多省份的抽查,约超过40%的中小企业在电子会计凭证归档环节存在不同程度的合规缺陷——包括但不限于只存PDF不存源文件、将截图当原件保存、提取数据后删除原始电子凭证。本文不讲概念,只讲规则和做法:哪些文件必须存、怎么存才算合格、以及"把发票提取到Excel"这件事和归档到底是什么关系。
Key Takeaways
- 国家档案局抽查显示超过40%的中小企业在电子发票归档上存在合规缺陷——不是不会做,是所有人被同一个认知惯性带偏了:把"打印出来贴在报销单后面"当成了归档的全部。
- 电子发票的三种交付格式在法律上不是"你喜欢哪个就用哪个"——带有数字签名的XML才是唯一的法定归档格式,OFD是推荐查阅格式,PDF连独立归档效力都没有,三者的差距不是推荐力度的强弱,是合法与不合法的区分。
- AI发票提取已经把手工录入从3分钟/张压到10秒/张——简录AI在这件事上的价值到此为止——导出后的Excel是你的工作文件,带数字签名的OFD/XML源文件才是30年保存期内审计和税务稽查唯一认可的法律凭证。
归档的底线变了:从"打印就行"到"双存是底线"
2020年3月,财政部、国家档案局联合印发《关于规范电子会计凭证报销入账归档的通知》(财会〔2020〕6号)。这是中国电子发票归档领域最重要的规范性文件——它把一条此前模糊的规则讲清楚了:电子发票的纸质打印件,不得作为报销入账归档的唯一凭证。
财政部官方答记者问给出的理由直白得不能再直白:"电子会计凭证的纸质打印件具有易篡改、易复制且难察觉等特点"。一张打印出来的电子发票,上面的发票代码、金额、税额可以被修改后重新扫描,财务人员仅凭肉眼难以分辨——这就是为什么纸打件不能独立成为归档凭证的根本原因。
财会〔2020〕6号第三条规定,单位可以仅使用电子会计凭证报销入账归档,但必须同时满足四个条件:
电子发票仅用电子形式归档的四个必要条件
- 查验合法、真实——接收的电子发票必须经过真伪查验;
- 传输存储安全可靠——对电子发票的任何篡改能够被及时发现;
- 核算系统能完整处理——会计系统能准确读取电子发票及元数据,能按规定格式输出,有审签程序,且能防止重复入账;
- 归档管理合规——符合《会计档案管理办法》(财政部国家档案局令第79号)的要求。
重点在第四条:单位以电子发票的纸质打印件作为报销入账归档依据的,必须同时保存打印该纸质件的电子发票原件。这就是"双存"规则的来源——不是你选电子还是选纸质的问题,是如果你用了纸质,电子原件也必须一起存。
2021年3月,中办、国办印发《关于进一步深化税收征管改革的意见》,正式启动金税四期建设,目标是从"以票管税"走向"以数治税"。金税四期的核心载体就是数电票——这意味着税务机关不再靠企业申报来"了解"你的发票情况,而是直接通过全量发票数据来"比对"企业的进销项。归档的每一张电子发票的元数据,未来都可能成为税务稽查的审计轨迹。
OFD/PDF/XML:不是格式偏好,是合规选择题
谈到归档,财务人员最常问的问题就是:"到底该存哪个格式?"但这个问题本身就暴露了一个认知偏差——OFD、PDF、XML不是"你更喜欢哪种"的审美选择,它们在法规中的合规地位完全不同。搞错格式,等于把复印当原件存了三年。
数电票(全面数字化电子发票)提供了三种交付格式。三种格式看上去都像发票,但在归档合规中的地位天差地别:
| 格式 | 用途 | 合规地位 | 能做的事/不能做的事 |
|---|---|---|---|
| XML | 发票元数据——包含发票全部结构化字段的数字电文 | 唯一法定归档格式(财会〔2020〕6号第三、五条) | ✅ 可作为唯一归档凭证 ❌ 人读不友好,是一串代码 ⚠️ 必须包含数字签名 |
| OFD | 国家标准版式文件——可查验监制章和电子签名 | 推荐双存(方便查阅+技术验证) | ✅ 可在阅读器中验证真伪 ✅ 人可阅读,适合日常翻阅 ❌ 拍照/扫描的OFD非原件 |
| 预览格式——给人看的 | 无独立归档效力 | ✅ 可以打印出来贴在报销单上 ❌ 不支持监制章和签名验证 ❌ 不能替代XML/OFD归档 |
很多财务人员把PDF当成原始文件保存,这在合规上是危险的。PDF文件的发票监制章和电子签名无法进行技术性验证——也就是说,一张被篡改过的PDF发票和一张真实的PDF发票,用肉眼看不出来,用工具也验不出来。而OFD文件可以在"增值税电子发票版式文件阅读器"(国家税务总局全国增值税发票查验平台可下载)中一键验证监制章和电子签名的有效性。
一句话记住格式规则
XML用于归档(必须存),OFD用于查阅和验证(建议存),PDF用于打印(不能替代前两者)。如果你收到的是非数电票的增值税电子普通发票(带发票专用章的那种),OFD格式才是原件,PDF只是预览。
归档四性:不是IT部门的事,是审计会看的东西
"真实性、完整性、可用性、安全性"——这八个字出现在几乎所有关于电子发票归档的官方文件中。但对于财务人员来说,这四个词太抽象了。把它们翻译成人能操作的检查点,才是这篇文章的价值。
国家税务总局发布的《电子发票全流程电子化管理指南》附录F,给出了四性检测的具体要点。以下是从中可以提取出来的、中小企业可以自己动手做的检查清单:
| 检测项 | 检测什么 | 不合格示例 | 企业自查方法 |
|---|---|---|---|
| 真实性 | 发票来源合法、未被篡改、数字签名有效 | 用截图代替原件存档;OFD文件被修改后签名失效 | 在阅读器中右键点击发票监制章→验证;查验平台录入发票四要素比对 |
| 完整性 | 发票文件完整(未损坏)、元数据完整(所有字段齐全)、关联关系完整(与记账凭证对应) | 只保存了OFD但没有保存XML;文件打不开;缺少与凭证号的对应关系 | 打开文件确认能正常显示;核对元数据字段数;建立发票-凭证号映射表 |
| 可用性 | 归档文件能检索、能阅读、能按需输出 | 存在加密U盘里没人知道密码;文件名全是IMG_001这种无法定位 | 用"日期+供应商+发票号"格式命名;确保打开工具可用;建立检索目录 |
| 安全性 | 存储介质安全、访问权限管控、防病毒防损坏 | 存在个人电脑C盘没有备份;共享文件夹全员可删改 | 建立定期备份机制(建议三份、两种介质、一份异地);设置只读权限 |
对于尚未建设电子档案管理信息系统的中小企业,四性检测目前主要依靠人工核对+建立台账。但这不是"可以不检测"的理由——审计人员在检查电子发票归档时,四性检测记录本身就是检查对象。即使你是手动做的,也要有记录。
提取≠归档:AI导出Excel不等于你可以删掉源文件
这是本文最核心的一句话,也是大多数在用AI/OCR工具处理发票的企业没有意识到的一个合规风险。
随着AI发票提取工具的普及,越来越多的财务人员形成了这样的工作流:收到电子发票 → 上传到AI工具 → 导出Excel → 跟财务软件对接。逻辑上这套流程是对的——提取确实可以代替手工录入。但很多人在最后一步犯了一个关键错误:把Excel当成了发票数据的最终形态,把原始的OFD/XML文件删了。
为什么这是错的?因为Excel里的数据是你从发票中提取出来的——但Excel不具备任何法律凭证效力。审计时税务局要查的不是"这些数字你记下来了没有",而是"这些数字是否来自一张真实、未被篡改的电子发票"。证明后者的唯一凭证,是带有数字签名的XML/OFD源文件,不是你导出的Excel。财会〔2020〕6号第四条的"必须同时保存电子发票原件",指的是原始电子发票文件——不是提取结果的Excel。
提取+归档的正确理解
简录AI这类工具能做的是:把发票上的数据提取出来、清洗格式、归类汇总到一张Excel里——这解决了录入的效率问题。但它不能也不应该替代归档环节。正确的做法是:提取完数据后,Excel用于记账和对账;同时把原始OFD/XML文件按归档规范保存——两者各司其职,缺一不可。
文件仅用于提取处理,处理完成后自动删除,不会被存储。
上面的演示展示了AI如何从发票中提取数据——输入你需要的列名(如"发票代码""发票号码""不含税金额""税额""销售方名称"),AI自动识别并填入,批量发票合并导出为一张Excel。这个步骤把你从手工录发票的3-5分钟/张压缩到5-10秒/张。但记住:导出Excel后,请把原始的OFD和XML文件按要求归档保存——Excel是你的工作文件,源文件才是你的法律凭证。
从接收到归档:一张电子发票的合规之旅
前面的内容回答了"规则是什么"和"为什么不能只存打印件/Excel"。现在把整个链路串起来——从你收到一张电子发票开始,到它合格地躺在归档文件夹里为止。
接收发票
从供应商获取电子发票的原始电子文件(OFD和/或XML格式)。关键动作:主动向开票方索取电子原件,不要只收一张PDF或截图。数电票会自动推送到双方的税务数字账户,登录电子税务局即可下载。
查验真伪
登录全国增值税发票查验平台,录入发票代码、号码、开票日期、校验码进行验真。OFD文件可在阅读器中右键验证监制章和电子签名。这一步骤必须有记录——保存查验结果截图或导出查验记录。
查重
电子发票可以无限复制,重复报销是最常见的风险之一。使用增值税发票综合服务平台的入账功能进行勾选入账标记,或在内部建立发票号去重台账。数电票的20位发票号码全国唯一,是天然的查重ID。
提取数据
使用AI提取工具(如增值税发票AI提取方案),将发票上的结构化数据提取到Excel——包括发票代码、发票号码、不含税金额、税额、价税合计、税率、销售方名称及税号等。批量发票可合并导出为一张表,直接用于记账和对账。注意:此步骤的产出是工作文件,不是归档凭证。
归档源文件
将原始OFD和XML文件按规范归档:创建"年月+发票号+供应商"命名规则的文件目录,进行四性检测并记录检测结果,建立发票文件与记账凭证号的对应关系表。有条件的企业可部署电子会计档案管理系统实现自动化归档;没有系统的企业至少要在本地或NAS上建立规范的文件夹结构和备份机制。
入账登记
完成会计核算后,在增值税发票综合服务平台标记发票入账状态,或在内部台账中更新入账标识。这一步防止同一张发票在不同时期被重复入账。月末核对税务端入账状态与内部台账的一致性。详细操作可参考增值税发票完整处理流程。
这个6步流程的关键区分在于:步骤4(提取数据)是用AI替代手工录入的环节,解决效率问题;步骤5和6是确保合规的环节,解决法律风险问题。把步骤4当成流程的终点,是企业最常见的归档合规失误。
三个最容易踩的合规坑
坑一:拿截图或照片当原件存档
财会〔2020〕6号第一条明确:"电子会计凭证,是指单位从外部接收的电子形式的各类会计凭证。"拍照、截图、扫描件属于电子副本——它们是人为二次生成的图像文件,不是开票系统推送的原始电子文件。副本文件没有数字签名,无法进行技术性真伪验证。财政部官方指引:"拍照、截图、扫描等电子影像件属于电子副本文件,并不是电子会计凭证原件,不能仅以电子副本文件报销入账归档。"收到供应商发来的微信截图说"发票发你了"——这不是合规的交付方式。请要求对方发送原始OFD/XML文件。
坑二:保存了PDF就以为完成了归档
PDF确实看起来比OFD更熟悉、更好用——几乎所有电脑都能打开PDF,而OFD需要专门的阅读器。但PDF文件的发票监制章和电子签名无法进行技术性验证。一个更好的做法是:OFD+XML双存——OFD存一份用于日后翻阅检查,XML存一份作为元数据归档的法定凭证。PDF可以在报销流程中作为打印和审批的辅助文件使用,但归档文件夹里必须有的是OFD和XML。
坑三:文件存了但没做四性检测
很多企业把文件往服务器某个文件夹里一扔就认为归档完成了。但归档不只是"存储",还包括"能证明存的东西是对的"。四性检测不是一次性的动作——它应该贯穿归档的全生命周期:归档时检测一次、定期(建议每半年)复检一次、审计或检查需要调阅时再检测一次。文件放三年后打不开了,或者数字签名已经过期无法验证——这在审计中同样会被认定为归档不合格。
常见问题
我们公司很小,没有电子档案管理系统,怎么归档才合规?
财会〔2020〕6号并没有要求必须有电子档案管理系统。对于中小企业,线下归档的基本做法是:(1) 在本地电脑或企业NAS上建立规范的文件目录结构(按"年份/月份"分层,文件以"发票号+供应商+日期"命名);(2) 建立电子发票台账(Excel即可)记录每张发票的文件名、归档位置、四性检测结果、对应凭证号;(3) 做好备份——同一批文件至少存两份,分别放在不同介质上。核心是:文件能找到、能打开、能验证——系统不是必要条件,规范才是。
我用简录AI把发票数据提取到Excel了,还需要保存OFD文件吗?
需要,而且必须。简录AI的提取功能帮你完成了发票数据的数字化录入——这是效率工具的价值。但提取出来的Excel数据不具备法律凭证效力。审计、税务稽查需要看到的是带有数字签名的原始电子发票文件(OFD/XML)——只有源文件才能证明数据的来源合法、未被篡改。正确做法:提取完数据,Excel拿去记账和对账;原始的OFD和XML文件按要求归档保存。两者各司其职。
数电票只有XML格式,没有OFD可以吗?
依据财会〔2020〕6号第三条和第五条,仅使用含有数字签名的XML文件进行报销入账归档是合规的——XML本身就是法定归档格式。但建议同时保存OFD或PDF版式文件作为辅助查阅文件,因为XML是一串代码,人无法直接阅读。实务中的推荐做法是:XML用于归档(法定凭证),OFD/PDF用于日常查阅(辅助文件)。二者不是替代关系,是互补关系。
金税四期对归档不合规有什么处罚?
根据财会〔2020〕6号第六条,违反本通知规定的行为,县级以上人民政府财政部门、档案行政管理部门可依据《中华人民共和国会计法》《中华人民共和国档案法》等有关法律、行政法规进行处理处罚。具体来看——《会计法》第四十二条对"未按照规定保管会计资料"的行为,可对单位处三千元以上五万元以下罚款,对直接责任人处二千元以上二万元以下罚款。更关键的是,金税四期自动比对机制下,归档不合规导致的发票数据缺失或异常,可能直接触发税务风险预警——罚款之外,企业信用评级也会受影响。
电子发票的保存期限是多久?
《会计档案管理办法》(财政部国家档案局令第79号)规定:原始凭证(包括电子发票)的保管期限为30年。不是5年、不是10年,是30年。这意味着你今天归档的电子发票文件,需要确保30年后能被找到、能打开、能验证真伪。这就是为什么四性检测中的"可用性"和"安全性"不是一次性工作——你需要考虑存储介质的寿命、文件格式的长期可读性、以及定期迁移备份的机制。
微信/支付宝收到的电子发票截图能当原件归档吗?
不能。截图是电子副本,不是电子原件。这一点财会〔2020〕6号的官方解释已经明确。正确做法:如果供应商通过微信发来了一张截图,你应该要求对方发送原始的OFD或XML文件(可以从开票系统或税务数字账户下载)。如果对方确实无法提供,你需要将截图连同"无法获取原件的情况说明"一并存档——但这种情况应尽量避免,不能成为常态。批量处理较多发票的企业,建议建立明确的供应商电子发票交付规范。
简录AI能帮我做四性检测吗?
简录AI的核心能力是发票数据的提取和结构化处理(将图片/PDF/OFD中的发票信息转为Excel),不是电子档案管理系统。四性检测需要专用的档案管理工具(如电子档案管理系统内置的检测模块、增值税电子发票版式文件阅读器的验证功能、以及人工核对台账)。简录AI在归档链路中的位置是"步骤4(提取数据)"——帮你从手工录入的3分钟/张提速到5-10秒/张,但归档(步骤5-6)需要独立的工具和流程来保证。
合规不是多存一个文件,是知道什么该存、什么该检、什么不该丢
回到开头那句话:金税四期不是突然降临的。数电票已经覆盖全国98%的用票企业,"以数治税"的自动比对体系已经运转起来。对于每一位处理电子发票的财务人员来说,归档这件事,以前可能只是一个"按规定走流程"的行政动作——现在它变成了一个需要准确判断的合规决策。
本文想让你记住的核心只有三句话:第一,纸质打印件不是归档凭证,电子原件才是——必须双存。第二,XML是法定归档格式,OFD是推荐辅助格式,PDF只是给人看的——别搞错。第三,AI提取工具帮你解决了录入效率,但它产出的Excel不是归档文件——提取完数据后,源文件一个都不能少。
归档合规的基础设施可以逐步建设,但对规则的认知偏差不能等。从今天开始检查:你的电子发票归档文件夹里是源文件还是截图?你做完四性检测了吗?你区分了"提取用的Excel"和"归档用的源文件"吗?