营业执照转Excel
统一社会信用代码、经营范围,批量汇总一张表
手工将一张营业执照的统一社会信用代码(18位)、企业名称、经营范围逐项敲进Excel,平均2到3分钟——批量录入30家供应商就是1.5小时。简录AI处理每张仅需5到10秒,横版/竖版/新旧版式混合上传,一次性输出统一汇总表。
文件不用于模型训练 · TLS 1.3 传输加密 · 处理后自动删除
营业执照上能提取哪些工商信息
输入你需要的列名——"统一社会信用代码""法定代表人""经营范围"——简录AI根据列名的语义在营业执照中定位对应数据,你输入的列名就是最终Excel的表头。不按坐标框选、不依赖版式模板,视觉大模型理解的是画面内容。
以上为营业执照常见提取字段。你还可以自由添加任何需要的列名——注册资本币种(人民币/美元/港元)、股东信息、社会团体法人登记证书上的主管单位等,AI均可按需提取。执照上没有但你需要分类的信息?看看下面的推断列。
营业执照提取的瓶颈不在"识别文字",而在"100张执照如何变成1张表"
百度OCR、阿里云OCR、腾讯云OCR的营业执照识别API都能"读出"统一社会信用代码和企业名称,但你的需求不是100次API调用和100个JSON——你需要的是1张Excel表,每家企业占一行,所有工商信息字段对齐。从100个JSON到1张汇总表之间的手工搬运,才是真正消耗时间的环节。
传统方案的问题
识别结果是一个个JSON,不是一张Excel汇总表
百度OCR返回JSON、阿里云返回JSON、腾讯云返回JSON——每张营业执照一次调用,得到一个独立的结构化数据。如果你有50家供应商的营业执照需要入库,你面临的选择是:要么写脚本循环调用API并拼接数据,要么把50个JSON逐一复制粘贴进Excel。识别本身只需0.5秒,但从识别到入库,中间的转换工作才是真正的瓶颈。
固定字段清单——不在列表里的信息,就提不到
各OCR平台的营业执照识别API返回10到20多个固定字段(统一社会信用代码、名称、法人、注册资本等)。但如果你的内部系统需要额外字段——比如"注册资本币种"(人民币还是美元)、"成立日期格式"(希望输出YYYY-MM-DD而非中文年月日)、或者营业执照上印着的"登记机关"——只要不在API的固定输出字段清单里,你就得自行补充。在知乎上, 多位财务人员反馈:哪怕只多需要一个"有效期截止日"字段,用完OCR后还是要打开原图对着手打,并没有真正做到"省事"。
横版、竖版、新旧版式混在一起,模板匹配准确率不稳定
中国营业执照历经多次改版——三证合一前的老版执照(15位注册号)、三证合一后的横版执照、部分地区使用的竖版执照、还有电子营业执照的截图。传统OCR API依赖版式模板做字段定位,遇到不常见的版式或模糊图像时,字段映射可能出错——"注册资本"和"实收资本"位置混淆、"成立日期"与"营业期限"互换。
简录AI的解法
自定义列名提取——你定义表头,AI批量填充,直接输出Excel
没有固定字段清单、没有JSON转换环节。你在输入框中写上想要的列名——"统一社会信用代码""企业名称""法定代表人""注册资本""经营范围""企业类型""登记机关"——AI根据列名的语义在每张营业执照中定位对应的值。上传50张营业执照,处理完成后下载一张XLSX文件:50行数据,列名即为你输入的表头,所有企业的工商信息整齐对齐。没有"先拿到JSON再手工合并"的中间步骤。
不需要任何版式模板——视觉大模型理解画面内容
无论横版、竖版、老版15位注册号、新版18位统一社会信用代码、带水印的复印件、手机拍的模糊照片——简录AI的视觉大模型通过理解画面内容来定位字段,而非依赖预先训练好的版式模板。这意味着它不关心"注册资本在第几行第几列",而是根据你输入的列名语义在画面中寻找对应的值。版式变化不影响提取结果。
推断列 + 计算列——在提取的同时完成分类和验证
推断列让AI根据营业执照内容推断执照上没有的信息。例如输入 企业规模(选项:大型/中型/小型/微型),AI会根据注册资本和经营范围自动判断企业规模类别——营业执照本身不会印"企业规模"四个字,但AI能做到合理推断。同样,营业执照上法定代表人是否同时是股东、经营范围是否包含特殊许可项目等,都可以通过推断列自动标注。
计算列则可以帮你自动对比和验证。例如输入 营业执照状态(计算:IF(营业期限截止日期<TODAY(), "疑似过期", "有效")),AI在处理每张执照时同步完成日期判断,结果直接显示在输出表中。
月底供应商资质更新——40家供应商的营业执照一次性入库
这不是虚构场景。采购部门每季度或每半年需要更新供应商资质档案,收集所有供应商的最新营业执照(副本照片或扫描件),录入统一的供应商管理系统。以下是实际工作流程。
收集所有供应商的营业执照文件
将40家供应商的营业执照拖入上传区——可能是照片(JPG/PNG)、PDF扫描件、微信传输的图片——格式不限、版式不限。如果你不想逐个收集文件,可以使用收集链接功能生成一个专属链接并发给各供应商联系人,对方点击链接后直接拍照上传营业执照,文件自动进入你的处理队列,无需对方注册。
输入12个列名,一次定义全字段
在列名输入框中填写:"统一社会信用代码""企业名称""法定代表人""注册资本""成立日期""营业期限""经营范围""注册地址""企业类型""登记机关""组成形式""正本/副本"。再加一个计算列是否到期(IF(营业期限截至日期<TODAY(),"到期","有效"))——AI提取时自动判断每张营业执照的有效状态,一眼定位需要续期的供应商。
导出汇总表,直接导入供应商管理系统
处理完成后下载一份XLSX文件:40行×13列(12个字段 + 1个计算列),每行对应一家供应商。统一社会信用代码列自动去除了空格、注册资本列已统一为数字格式、日期列已标准化——这份表可以直接作为供应商管理系统的导入文件,或作为采购部门资质更新台账的底稿。不再是40张营业执照×逐行手工录入×逐张验证有效期。
适用场景与注意事项
不写"什么都能做"。以下是真实的能力边界——知道什么情况下效果好、什么情况下需要谨慎,比一份夸大的功能清单更有用。
效果最佳的场景
✓ 清晰照片或扫描件,光线均匀
营业执照是印刷体文档,文字清晰度通常较好。印刷体识别准确率最高可达99%,特别是统一社会信用代码、企业名称等核心字段——这些文字区域天然是营业执照上最规范的部分。手机拍摄时,保证光线均匀、正面取景、对焦清晰即可获得理想效果。
✓ 批量供应商资质入库、企业信息电子化存档
这是本工具最匹配的场景。几十甚至上百张营业执照混合上传,直接输出一张汇总Excel——完全省去了"逐张识别→手工合并→逐个校验"的中间环节。采购部门、财务部门、行政部门批量更新供应商或客户工商档案时,效率提升最为显著。
✓ 企业类型、经营范围等需要后续分类和筛选的字段
传统OCR工具输出的是纯文本,你还需要在Excel里手动分类。简录AI的推断列机制可以让AI根据企业类型自动标注"有限责任公司/个体工商户/股份有限公司",根据经营范围自动标示是否涉及食品、医疗、工程等特殊许可行业——提取的同时完成分类,拿到表就能直接用。
需要留意的场景
⚠ 严重模糊、反光遮挡、图像残缺的执照照片
图像质量直接影响识别准确率。如果营业执照照片存在大面积反光(特别是塑封过的执照)、严重透视变形(斜拍)、或边缘裁切缺失,文字区域可能被误读。建议补拍清晰照片后再上传——尤其是统一社会信用代码18位,一个字符的错误就需要到公示系统手动核查。
⚠ S形翻拍屏幕、多次复印后墨迹晕染的复印件
对着电脑屏幕翻拍营业执照(电子版截图再拍照),会产生摩尔纹干扰识别。多次复印的纸质营业执照可能出现字迹模糊、油墨晕染——特别是经营范围区域,文字密集,晕染后相邻字符的边界变得模糊,识别准确率会下降。尽量使用原始扫描件或清晰照片。
⚠ 营业执照验真不在本工具范围内
简录AI负责从营业执照图片中提取文字信息——统一社会信用代码、企业名称、法定代表人等。但这不等同于营业执照真伪核验。如需确认营业执照的真实性和有效性,请登录国家企业信用信息公示系统,输入统一社会信用代码或企业名称进行查询。也可使用百度AI、阿里云提供的营业执照核验API单独进行三要素/四要素比对。
常见问题
统一社会信用代码(18位)准确率怎么样?老版的15位注册号还能识别吗?
统一社会信用代码(18位,字母与数字组合,如 91440300MA5DXXXXXX)是营业执照上印刷最规范、最清晰的字段,识别准确率最高可达99%。18位中的第18位是校验码——你可以利用计算列验证识别结果:输入 代码校验(IF(LEN(统一社会信用代码)=18, "正常", "需复核")),AI自动检查位数并标记异常行。
对于三证合一前的老版营业执照(15位注册号),简录AI同样可以识别。视觉大模型理解的是画面内容,不依赖"18位"或"15位"的字符长度规则——无论几位代码、无论编码格式如何变化,只要印刷清晰就能准确提取。
经营范围文字很长,有时几百字还带特殊许可项目,会漏字或截断吗?
不会。经营范围是营业执照上文字量最大的字段——部分综合型企业的经营范围可能包含100多个经营项目,总字数达300到500字。简录AI的视觉大模型按语义理解文本区域,而非按行坐标逐行切割。经营范围即使跨多行、跨多段、存在分号或编号换行,AI也能将其完整提取为一个文本块,输出到Excel的同一个单元格中。
如果你需要进一步从经营范围中提取特定关键词——例如判断是否包含"食品经营""医疗器械""建筑施工"等特殊许可项目——可以在列名中使用推断列:特殊许可(选项:食品/医疗/建筑/危化品/无),AI在读取经营范围文本后自动判断并标注。
营业执照有横版、竖版、新版、老版,不同版式混在一起能一起处理吗?
可以混合处理,不需要分类或预处理。简录AI的视觉大模型不依赖版式模板——它通过理解画面内容来定位字段,而非依赖"注册资本在第几行第几列"的固定坐标。你可以将横版执照、竖版执照、新版电子营业执照截图、甚至部分地区特殊版式的执照全部放进同一个批次上传,输出Excel的字段对齐一致。
这正是VLM(视觉大模型)相比传统OCR模板匹配的核心优势:传统模板匹配在版式改变时需要重新标注训练,VLM通过语义理解直接读取页面内容,不关心布局差异。
法定代表人、注册资本这些字段提取准吗?怎么确保没有识别错误?
法定代表人姓名、注册资本金额等核心字段属于印刷体文字,识别准确率最高可达99%。但严谨的企业工商信息录入不容出错——因此建议充分利用计算列来做自动一致性校验:
例如输入验证列 代码长度(LEN(统一社会信用代码)) ——如果某行输出不是18,说明识别有缺失。再输入 注册资本数值(VALUE(SUBSTITUTE(注册资本,"万元",""))) 将注册资本转为纯数字,方便后续做数值比对。整个校验过程在AI提取时同步完成,不需要提取后再手工逐行对照原图。
但最终的关键字段(特别是统一社会信用代码)仍建议在入库前做一次抽查确认——这是合规要求,而非工具限制。
导出的Excel能不能直接对接用友/金蝶/SAP等企业系统的供应商管理模块?
简录AI导出的XLSX文件是标准Excel格式,列名完全由你自定义——你可以将列名设置为与用友、金蝶、SAP或其他ERP系统要求的导入字段名称完全一致。例如系统要求供应商导入模板的列名为"统一社会信用代码""供应商名称""法人代表"——你就在简录AI中输入这些精确的列名,导出的Excel可以直接作为系统的导入文件,无需二次调整表头。
此外,简录AI支持智能数据后处理:可以自动将繁体中文企业名称转为简体、将日期统一为YYYY-MM-DD格式、将注册资本中的全角数字转为半角、自动去除统一社会信用代码中的空格——这些标准化清洗在导出前就已自动完成,数据可以直接进入企业系统。
了解更多:从任意文档中提取指定字段 —— 自定义列名提取机制的完整介绍 · 从扫描件表单中提取指定字段 —— 纸质文件逐字段提取的实操指南 · 人工录入Excel的隐性成本 —— 为什么手动录入比你以为的更贵