审计抽凭,凭什么不能自动化?——凭证+附件批量提取建底稿

审计抽凭的起点是抽样,终点是底稿。中间的过程,在大大小小的事务所里,惊人地一致——翻开凭证、看记账凭证上的分录、翻后面附的原始凭证、核对金额与业务实质、把关键信息逐条敲进审计底稿的"凭证抽查表"。一套看似标准化的动作,在整个年审季重复几百遍。而真正让人焦虑的,不是"每张凭证要敲多少字"——是一张凭证背后的原始附件可能多达五到八页,而每页附件里的关键信息都需要被审计底稿记录下来。

根据《中国注册会计师审计准则第1314号——审计抽样》,抽凭是实质性测试的核心程序:从样本总体中按审计目的选取凭证,逐张检查金额准确性、会计处理适当性、审批完整性和凭证要素齐全性——检查结果写入审计底稿的凭证抽查表。一条检查结论的背后,是至少四到五个字段的录入和一份原始凭证的翻阅。简录AI不做审计工作——不代替审计师的职业判断、不出具审计结论。但它可以解决抽凭流程中那个纯机械的环节:把凭证和附件上的关键数据,从眼睛看、手敲键盘,变成AI批量读取、统一归表。

审计抽凭批量提取记账凭证和原始附件数据到审计底稿Excel

Key Takeaways

  1. 一张被抽到的记账凭证在审计底稿里可能产生25到40个需要录入的独立数据点——80张凭证就是1500个以上。
  2. 同一张凭证背后的附件类型多达5到8种,模板OCR会因为格式碎片化而完全失效。
  3. AI语义提取不靠模板不靠坐标——你定义好底稿列名,凭证和附件的数据自动归入同一张表,省下的时间全部还给实质性分析。

抽凭不是翻凭证——它是一张必须填满的审计底稿模板

一个常见的误解是,抽凭就是"翻翻凭证,看看有没有问题"。但在审计实务中,抽凭是一套有严格底稿格式要求的实质性程序。根据《中国注册会计师审计准则第1314号——审计抽样》第十六条,注册会计师应当评价样本结果,以确定对总体相关特征的评估是否得到证实或需要修正——这意味着抽凭不只是"查"了就行,每一张被抽到的凭证的检查过程和结论,都必须在审计底稿中留痕

实务中最常见的抽凭底稿格式是凭证抽查表——这张表通常包含以下字段:被审计期间、凭证日期、凭证编号、凭证种类(记账/收款/付款/转账)、科目名称、摘要、借方金额、贷方金额、所附原始凭证名称及张数、检查内容(金额准确性/会计处理适当性/审批完整性/凭证要素齐全性)、检查结论、审计说明。一份完整的凭证抽查表,每行对应一张被抽到的记账凭证——而这张记账凭证后面,可能附着一到多份原始凭证:增值税发票、采购合同、入库单、验收单、费用报销审批单、银行回单。

抽凭中最容易被低估的时间成本:附件信息摘录

一项对审计师日常工作的调研显示,审计忙季中48.1%的从业者每周工作51-60小时,另有31.4%超过61小时。一个经常被忽视的现象是:翻附件本身不耗时——耗时的是翻完后,把发票上的开票日期、发票号码、销售方名称、金额、税率这些字段,从原始凭证上逐条摘录到审计底稿里。而这个动作在传统抽凭流程中无法省去——底稿要求记载"所附原始凭证",审计准则要求审计证据有充分、适当性。

一张凭证抽查表里到底要填多少字段——以及为什么每行信息密度不同

不同事务所、不同项目的凭证抽查表格式略有差异,但核心字段高度一致。以常规财务审计中的抽凭程序为例,一张标准凭证抽查表至少包含两个层次的信息:记账凭证层(凭证号、日期、摘要、借贷分录)和原始凭证层(附件类型、关键信息、金额核验)。

字段层次典型字段数据来源信息密度
记账凭证凭证日期、凭证编号、摘要、总账科目、明细科目、借方金额、贷方金额、制单人记账凭证本身每张凭证 8-10 个独立数据点
附件张数、附件的发票号码、发票日期、销售方名称、金额、税额、合同编号、验收单号原始附件(发票/合同/验收单/审批单)每份附件 3-6 个独立数据点,1 张凭证可能附 3-8 份附件
审计结论检查内容(金额准确/会计处理/审批/要素齐全)、检查结论、异常说明审计师职业判断每张凭证 3-5 个判断项

这意味着:一张被抽到的记账凭证在审计底稿中产生的数据录入量,不是"抄几行字"——至少是8到10个来自记账凭证的数据点 + 每份附件3到6个数据点乘以附件数 + 3到5个审计判断项。如果一张凭证附了4份附件,这单张凭证在抽凭底稿中会产生大约25到40个需要录入的独立数据点。被审计单位的凭证少则几十张,多则几百张——假设审计抽样选出80张凭证,总数据点可能超过1500个,且这些数据分布在两种完全不同类型的文档上(记账凭证和原始附件),格式、排版、字段位置各不相同。

记账凭证背后的原始附件——抽凭真正的信息黑洞

记账凭证批量提取中我们拆解过:记账凭证本身的结构性很强——每张凭证都有固定的分录行格式,日期、凭证号、科目、借贷金额的位置相对规律。但当抽凭程序指向"检查所附原始凭证"时,问题就从"格式相对固定"变成了附件类型的高度碎片化

同一张记账凭证背后的附件可能包含:增值税专用发票(税务监制格式,有固定的票面模板)、采购合同(法律文书格式,无固定模板)、入库验收单(企业内部自制)和银行付款回单(各家银行的自有格式)。四种附件、四种版面、四种信息层级。而审计底稿要求逐份记载关键信息:发票的号码、日期、金额、税率;合同的关键条款和金额;验收单的签收人和日期;银行回单的付款金额和账号。这些信息不在同一个文档里,不在同一套字段体系里——但最终要归入同一张凭证抽查表。

传统做法下,审计员把附件翻开,看着手里的纸质凭证或扫描件,逐页在底稿中录入。这个动作重复几百次后,肌肉记忆和视觉疲劳交替出现——不是因为数据量大,而是因为每页附件的格式都不一样,眼睛要不断适应新的版面布局。上一张是税控发票的标准格式,下一张是企业自制入库单的非标准排版,再下一张是银行回单的自有格式。这个"格式切换"的隐性成本,才是抽凭手动录入环节中最消耗精力的部分。

审计档案归档规范对凭证抽查表的格式要求

根据《中国注册会计师审计准则第1131号——审计工作底稿》,审计底稿应当清晰记录审计程序的性质、时间安排、范围和结果。凭证抽查表作为实质性测试底稿的核心组成部分,必须包含:被测试凭证的索引信息、检查过程的留痕记录、检查结论以及交叉索引信息——指向相关的审定表、明细表和函证控制表。一份编写不完整、字段缺漏、附件信息未记载的凭证抽查表,在执业质量检查中会被判定为"凭证抽查流于形式"。

格式碎片化如何让"找坐标"的提取方案在抽凭场景里完全失效

如果你接触过传统OCR或模板型文档提取工具,可能会想:能不能提前设置好模板,让工具按固定坐标去读?这个思路在发票处理中有一定空间——因为增值税发票有标准模板。但放到审计抽凭场景里,模板方案会遇到根本性矛盾

矛盾一:同一张凭证后面附着的多种附件,不属于同一模板类型——你没办法用一个"发票模板"去读取采购合同、用一个"合同模板"去读取银行回单。一个抽凭任务涉及的附件类型可能多达5到8种,为每种维护一个模板的工作量,可能比手动录入还大。矛盾二:即使同一种附件类型,不同企业的格式也完全不同——A企业的入库单有三栏、有审批人签名区,B企业的入库单是打印的系统流水表。这不是模板能解决的问题,因为模板的底层假设是"同一模板适用同一类文档的批量处理"——审计抽凭天然不具备这个前提。

这正是自定义列提取的机制优势所在。它不依赖模板、不依赖坐标——你定义你想提取的列名(如"发票号码""发票日期""销售方名称""不含税金额"),AI基于语义理解在文档中自主定位对应的值。它看文档的方式类似于人:不是记住"第三行第二列是金额",而是理解了"金额"这个词的语义含义后,在文档的任何位置找到它。记账凭证和它背后的增值税发票、采购合同、入库单、银行回单——格式不同、排版不同、字段位置不同——但对AI来说,只要文档上有"发票号码"这几个字,或者有符合发票号码格式的数字串,它就能提取。

模板方案的瓶颈

  • 附件类型碎片化:一张凭证背后可能有发票、合同、验收单三种附件——每种都需要各自的模板,维护成本远超手动录入本身。
  • 跨企业格式不统一:不同被审计单位的自有凭证格式不同——模板无法跨客户复用,每个新项目都要从零配置。
  • 审计判断无法模板化:模板只能提取"写在上面的数据",无法辅助识别凭证要素是否齐全、审批是否完整。
推荐方案

语义提取 + 人工判断

  • 附件类型无关:AI按你定义的列名(发票号码、合同金额、验收日期)在任意附件中定位对应字段——不区分文档类型。
  • 跨客户复用:同一套列名(凭证编号、科目、借贷金额、附件信息)适用于不同被审计单位——无需逐项目配置模板。
  • AI提取 + 人工复核:数据归表后,审计师直接在提取结果上做职业判断、补充审计说明——提取和判断分两个阶段,互不干扰。

从被抽到的凭证到审计底稿:批量操作的四个步骤

以下展示的是简录AI在抽凭数据处理中的实操流程。简录AI的核心机制是自定义列提取:用户在界面里输入想要提取的列名,AI根据列名的语义在文档中定位对应的值并填入对应列。你输入什么列名,最终输出的Excel表头就是什么——文件名(凭证编号)也会被自动关联到每一行。

1

扫描/拍摄被抽到的凭证及其全部附件

将审计抽样程序选出的记账凭证连同后面所有原始附件,拍照或扫描为PDF/图片。注意每张凭证的全套附件放入同一文件或按顺序命名——文件名即凭证编号,AI提取后会自动将凭证编号关联到每一行数据。同一批次中的所有凭证一次性上传,不需要逐张处理。

2

定义提取列名——记账凭证 + 附件全覆盖

列出你想提取的所有字段。对于抽凭底稿,推荐列名:凭证编号、凭证日期、摘要、总账科目、明细科目、借方金额、贷方金额、附件张数、附件类型、发票号码、发票日期、销售方名称、发票金额、发票税额。列名可以包含来自记账凭证和附件的任一层字段——AI会自动辨别哪些信息在凭证上、哪些在附件里。

3

AI批量提取 + 合并输出为一张Excel表

点击处理后,AI逐张理解凭证和附件的内容,按你指定的列名提取对应数据。同一张凭证上的多行分录会逐行提取,借方金额和贷方金额各自归入正确列。凭证编号自动关联到每行,附件信息与凭证分录在同一条记录中。输出结果是一张合并的Excel表——所有被抽凭证的数据在一张表中,按凭证编号和分录内容排列。印刷体识别准确率最高可达99%。

4

复核数据 + 填入审计判断 → 归档为正式底稿

提取完成后,审计师在提取结果表的基础上做职业判断:在"检查结论"列标记每张凭证的检查结果、在"审计说明"列记录异常情况、完成交叉索引指向相关审定表。简录AI不做这个环节——它不代替审计判断、不出具审计结论。它做的是把"从凭证上看数据"这个纯机械的步骤自动化,让审计师的时间花在真正需要专业判断的地方。

关于输出结果与审计软件的衔接:提取后的Excel表可以直接复制到审计软件(如鼎信诺、用友审计)的凭证抽查表模板中。对于使用鼎信诺系统的审计团队,鼎信诺的凭证抽凭功能支持"判断抽凭"和"数理统计抽凭"两种方式——AI提取的数据可以作为判断抽凭的依据,先完成数据归集,再在软件中完成抽凭标记和底稿归档。

不止提取:让AI在输出时同步完成借贷平衡校验和附件数量比对

抽凭的实质性测试中,有两项检查几乎是每张凭证都要做的:一是记账凭证的借贷平衡校验——验证被抽到的凭证中所有借方金额之和是否等于贷方金额之和;二是凭证上记载的附件张数与实际附着的附件数量是否一致

传统做法是在所有数据录入Excel后,手动拉公式或用SUMIF按凭证编号分组汇总借贷金额再比对。简录AI的计算列功能可以在提取阶段就完成这些校验——不只是提取文档上有的数据,还可以让AI在提取时同步执行运算,将运算结果作为新的列直接输出。你可以设置如下计算列:

计算列名运算逻辑审计抽凭中的用途
借贷差额(借方合计 − 贷方合计)按凭证编号分组,对同一凭证下所有分录的借方金额和贷方金额分别求和后相减差额不为零的凭证立即定位,无需手工排查
附件数量比对(实际附件数 − 记载附件数)AI识别凭证上记载的附件张数,与实际扫描的附件数比对缺附件或多付件的情况直接标记
发票金额核验(发票金额 − 记账凭证分录金额)从附件发票中提取金额,与记账凭证对应分录的金额比对金额不一致的业务线索即时发现

计算列 vs Excel 公式:为什么在提取阶段就完成校验更可靠

Excel公式依赖单元格位置——在输出表中手动插入行后,SUMIF的范围可能错位,造成"假平衡"。计算列在AI提取时就完成运算,结果作为静态值直接写入输出表——后续任意编辑表格都不会改变计算结果。这在审计底稿归档层面尤其重要:底稿中的数值必须可追溯且不会因事后操作而变动。

年审季的时间窗口——抽凭数据处理不是繁琐,是工期杀手

根据中国A股上市公司的年报披露时限,审计工作的核心窗口在12月至次年4月。对于审计团队而言,大量抽样选出的凭证在这个窗口内集中产生,数据分析、底稿编制和报告出具的时间互相挤压。根据一项针对会计审计从业者忙季工作量的调查(Distinct Recruitment, 2025),48.1%的审计和税务从业者在忙季每周工作51-60小时,54.6%描述忙季"非常或极端有压力"——而senior级别的审计员压力比例高达75%。

抽凭这件事在整个忙季工作量中的占比,不会超过20%。但它的特殊性在于:抽凭是后续一切分析的前置环节。一天不完成抽凭数据的录入和复核,后续的审定表编制、分析性程序、差异调查就一天无法启动。它像高速路上的收费站——本身吞吐量不大,但堵在这里,整条路都动不了。在这个前置环节被卡住,对于后面时间更紧的审计报告阶段,意味着用于实质性分析和判断的时间被进一步压缩。

这也是为什么用AI做抽凭数据的批量提取不是"更好",而是改变了时间分配结构。一张凭证从"翻附件→看凭证→敲数据→核对"可能需要3-5分钟,AI提取一张只需要5-10秒。对于审计抽样选出的80张凭证,这个步骤从可能消耗半天到一天,压缩到几分钟。省下的不是数据录入的时间——是在审计报告出具前多出来的实质性分析、判断和复核的时间。关于年审函证环节的批量数据归集问题,我们在审计询证函批量处理中有过类似的拆解。

常见问题

简录AI能做审计抽凭吗?

简录AI不做审计工作——不代替审计师的职业判断、不执行审计程序、不出具审计结论。简录AI能做的是审计抽凭过程中的数据处理环节:把被抽到的记账凭证和原始附件上的关键字段批量提取为结构化表格——审计师拿到提取结果后,在此基础上做复核、判断和归档。它解决的是"从凭证上把数据读出来"这个纯机械步骤,而不是"这张凭证有没有问题"这个需要CPA专业判断的步骤。审计准则要求的凭证抽查、实质性测试、职业怀疑——这些是审计师的专业领域,工具只能辅助数据采集,不能替代。

能同时处理记账凭证和它后面的附件吗?

可以。将记账凭证连同附件作为同一个文件上传(或按顺序命名),在列名中同时定义来自凭证的字段(如"凭证编号""借方金额""贷方金额")和来自附件的字段(如"发票号码""发票日期""合同金额"),AI会在同一文件的不同页码中分别定位对应信息,合并输出到同一行。但需要注意:如果凭证和附件是分别独立上传的独立文件,AI无法自动建立跨文件的关联关系——建议拍摄或扫描时将凭证和所属附件合并为一组。

抽凭中涉及的审计判断(如金额准确性、审批完整性)AI能判断吗?

不能,也不应该。审计判断包含职业怀疑和专业分析——比如判断一笔交易的商业实质、评估会计处理是否恰当、识别潜在舞弊风险——这些是注册会计师的法定职责和核心价值。AI提取的结果表中的"检查结论"和"审计说明"列,应由审计师根据提取后的数据进行专业判断后手工填入。AI的价值在于让审计师不必花时间把数据从凭证上抄进Excel,从而把更多精力投入真正需要专业判断的环节。

手写的凭证附件(如手签合同、手写审批单)能提取吗?

简录AI支持手写文字的识别和提取,包括连笔字、草体字。但手写识别的准确率受字迹清晰度影响——工整的手写字可以准确提取,极度潦草的字迹可能产生识别偏差。建议对手写附件进行复核,确保提取结果的准确性。

提取结果如何进入审计软件和审计底稿?

提取结果为Excel (XLSX) 文件,可以直接复制粘贴到审计软件(如鼎信诺、用友审计等)的凭证抽查表模板中。也可以作为审计工作底稿的附件单独归档。数据格式已标准化——日期统一为YYYY-MM-DD、金额为纯数字——可直接引用到审定表和交叉索引中。

什么类型的抽凭不适合用AI提取?

AI提取最适合的是字段信息明确写在凭证和附件里的场景。如果审计抽凭程序涉及大量纯定性判断(如评估内控缺陷、分析交易商业实质),这些判断本身就不属于数据提取的范畴——AI无法代替。另外,极低质量的扫描件(如模糊到人眼也无法辨认)也超出AI提取的能力边界。

将抽凭数据处理从半天降到几分钟

上传被抽到的记账凭证和附件,定义你需要的底稿字段——AI批量提取,合并输出为一张可直接入底稿的Excel表。

免费上传试用