一票货走了四种运输方式,四套单据怎么统一提取到一张表

一票货从东莞工厂到德国仓库,经历了公路拖车+海运+铁路+末端配送——四段运输,产生四套单据:公路运单、海运提单、铁路运单、末端配送签收单。每套单据的信息格式不同、字段名不同、签发主体不同,但它们共享同一个集装箱号和合同号。月底汇总时,如果手工逐套录入,输入的不是四份单据——是四套各自为政的数据结构在Excel里的反复重建。

这不是某一个人的问题。2024年中欧班列全年开行1.9万列、发送207万标箱,中国境内128个城市开通中欧班列,通达欧洲26个国家232个城市。多式联运的爆发式增长,让"单据处理"这个原本被忽视的环节,变成了物流操作链上最耗人力的瓶颈。

多式联运单据统一提取海运铁路公路运单汇总

Key Takeaways

  1. 一票货从东莞到德国走了公路拖车+海运+铁路+末端配送四段,产生四套运单——每套字段不同、语言不同、签发主体不同,但共享同一个集装箱号,手工汇总时你需要先在脑子里建一套把港口代码翻译成地名的规则。
  2. 给四种运单各建一套模板是传统OCR的路径——但海运提单用英文港口代码、铁路运单用站名、公路运单用完整地址,换了船公司或口岸模板又得重新调试,维护成本抵消了自动化收益。
  3. 不建模板、不分类上传——你只定义"集装箱号""起运地""承运人"这些列名,简录AI在四种运单中各自找到对应值,四套单据同一批上传同一张表输出,集装箱号成为天然的跨文档锚点。

一票货四段运输,四套单据的字段到底差在哪

要理解统一提取的难点,先得看清四种运单的核心差异。下面这张表是一票典型的中欧贸易货物——从东莞经深圳港海运到汉堡、经铁路转运到慕尼黑、最后公路配送到仓库——途中产生的四套运单的字段对比:

字段海运提单
(Ocean B/L)
铁路运单
(Rail Waybill)
公路运单
(Road CMR)
多式联运提单
(Multimodal B/L)
运输段港口→港口铁路站→铁路站门→门 / 站→门全程(多段合并)
承运人船公司(如Maersk/COSCO)铁路公司(如中铁集/DB)公路运输公司多式联运经营人
单据编号格式B/L NO. + 字母数字组合运单号 + 数字串运单号 / CMR编号MTD/BL + 编号
起运地/目的地表达港口代码(如SZX/HAM)站名(中英文混排)完整地址多段起止点,可能含中转站
集装箱号位置主栏位,显著标注可能在备注或"箱号"字段通常不出现整合各段,含多个箱号
品名/货物描述英文描述,含HS编码中文/英文,可能缩写简短描述综合描述,含各段汇总
件数/重量标准栏位标准栏位标准栏位各段汇总,可能含总件数
签发日期On-board date / Issue date发车日期提货/发车日期各段日期或单一签发日

这张表说明了一个根本问题:四种运单描述的是同一票货的同一次运输,但表达方式完全不同。提单用英文港口代码,铁路运单用站名,公路运单用完整地址——三者指向同一个集装箱,但数据格式没有交集。手工汇总时,你需要先在脑子里建立一套"翻译规则",把每种运单的表述统一成同一种格式,然后逐份录入。这个翻译+录入的过程,就是人工成本的核心。

多式联运"一单制"改革还未全面落地

交通运输部等多部门正在推进多式联运"一单制"改革——目标是"一次委托、一次结算、一单到底"。2023年8月发布的《关于加快推进多式联运"一单制""一箱制"发展的意见》明确了方向。但现实是:大多数企业的日常操作中,四种运单仍然各自独立签发,统一提取是当前阶段最实际的解决方案

为什么模板式提取在多式联运场景失效

传统的OCR数据提取方案基于模板匹配:先定义"发票号在左上角、日期在右上角",然后按坐标框选。这种思路在单一文档类型、单一格式的场景里能用——比如同一家供应商的标准发票。

但多式联运场景有四个"不同":不同运输方式、不同签发主体、不同语言(中英德混排)、不同字段名。海运提单的"Consignee"在铁路运单里叫"收货人",在多式联运提单里可能叫"Delivered to"。给四种运单各建一套模板是多数传统方案能想到的路径——但这样一来,模板维护成本抵消了自动化收益,而且换了船公司或换了口岸,模板又得重新调试。

简录AI的自定义列名提取机制走了一条不同的路。它不是按坐标定位,而是按语义理解——你在提取界面上输入想要的列名(如"集装箱号"、"起运地"、"承运人"),AI在文档中寻找语义匹配的值。集装箱号不管印在提单的哪一栏,AI都能理解这是一串符合ISO 6346格式的集装箱标识码并提取出来。这个机制单篇文章讲不完,可以参考自定义列名提取的完整介绍——但核心是:列名是语义指令,不是坐标定位

模板式 vs 语义式,在多式联运场景下的核心差异

模板式方案要求"同一种单据的格式不能变"——所以四种运单需要四套模板,且每种船公司/铁路公司的版本变化都要维护。语义式方案只要"你知道想要什么字段"——四种运单同一套列名、同一次上传、同一份输出。不是你建模板,是列名本身就是对AI的提取指令

三步操作:从四套单据到一张统一运输汇总表

以下流程不需要先分类、不需要先建模板、不需要按运输方式分批处理。四套运单的照片或PDF,一次性上传。

第一步:上传全部运单,不分类

把一票货的公路运单(CMR)、海运提单(B/L)、铁路运单、多式联运提单的扫描件或手机拍照一次性上传。不需要按运输方式建文件夹、不需要把英文提单和中文铁路运单分开——混合上传,AI在处理时会根据文档内容分别提取。

实际场景中,这些单据的来源五花八门:船公司邮件发的PDF提单、货代微信发来的铁路运单截图、司机带回的纸质公路运单拍照。简录AI支持PDF、JPG、PNG、WebP等多种格式,拍照和截图都可以直接传。单页文档处理仅需5-10秒。

第二步:设定统一列名,覆盖四种运单

在列名设置中输入以下字段——这套列名设计的原则是:每种运单至少能贡献5个字段,关键字段(集装箱号、日期、品名)四种运单都能出。

列名海运提单能出?铁路运单能出?公路运单能出?多式联运提单能出?
运输段✅ 深圳→汉堡✅ 汉堡→慕尼黑✅ 慕尼黑→仓库✅ 全程汇总
运输方式✅ 海运✅ 铁路✅ 公路✅ 多式联运
承运人
起运地✅ 港口✅ 站名✅ 地址✅ 多段
目的地✅ 港口✅ 站名✅ 地址✅ 终点
单据号✅ B/L No.✅ 运单号✅ 运单号✅ MTD编号
日期✅ On-board date✅ 发车日✅ 提货日✅ 签发日
集装箱号△ 部分
品名
件数
重量

这里有两点值得展开:推断列运输方式的自动归类。简录AI的自定义列名支持推断模式——你可以在列名中指定分类规则,AI根据文档内容自动判断归属。例如,在"运输方式"列设定"选项:海运/铁路/公路/空运/多式联运",AI读完整份运单后自动判定该单据对应的是哪种运输方式并填入。同样,如果合同号没有单独出现在运单上但你有一份关联的装箱单或交货单作为参考,也可以一并上传,AI会跨文档匹配关联信息。

第三步:一键导出,四张运单变成一张运输汇总表

点击处理,AI逐份读取每张运单,按你设定的列名提取对应字段,所有结果汇入同一张表。导出格式可选Excel(XLSX)、CSV或JSON。

最终输出是一张统一格式的运输汇总表,每一行是一个运输段,每一列是你指定的字段。四套原本格式各异、语言不同的运单,现在以同样的数据结构排列在同一个表格里——按运输段排序后,整票货从东莞到德国仓库的全链条可视化就出来了。

效率参考

单页文档手工录入平均需要约3分钟——四套运单、每套可能有2-3页,一票货的手工录入时间在20-30分钟。用简录AI处理,单页文档5-10秒完成提取,四套运单总计不到1分钟。乌鲁木齐"天山号"铁空联运平台的实践数据显示,多式联运单证处理从2-3天压缩至实时生成,压缩幅度达95%。虽然这是平台级别的数据,但操作逻辑与文档级的AI提取一致:信息提取的时间成本是可以归零的

中欧班列的爆发与单据处理的新压力

多式联运单据处理之所以从一个"可以做"的效率优化变成"必须做"的刚需,背后是中欧班列的爆发式增长。

中国国家铁路集团有限公司数据显示,2024年中欧班列全年开行19,392列、发送207万标箱,同比分别增长10%和9%。其中西安以3,849列高居全国第一,成都2,285列、重庆2,059列、郑州2,052列形成第一梯队。中欧班列运输货值由2016年的80亿美元增长到2023年的567亿美元,在中欧贸易总额中的占比从0.4%提升至8.5%。

这背后的单据量是三个量级的叠加:每列班列运几十个集装箱,每个集装箱产生一套运单,每个进口商月底要汇总所有运单做运费结算、货权核对、保险理赔。当运单数量从每月几十套增长到几百套时,手工录入的边际成本不再是"多花点时间"——而是"不自动化就做不完"。

更关键的一层变化是运输方式的混合越来越常见。2024年跨里海中欧(亚)班列同比增长24倍——这条走廊从中哈边境出发,经里海轮渡、穿阿塞拜疆和格鲁吉亚到达土耳其和欧洲,本身就是一票货中"铁路+海运+铁路+公路"四段混合的典型路径。全链条的单据处理需求只会越来越大。

在多式联运中,有一个字段贯穿了所有运单——集装箱号。同一票货从公路拖车装柜开始,到海运装船、到铁路转运、到末端配送拆柜,全程用的是同一个集装箱。ISO 6346标准的集装箱号(格式如 MSCU1234567)出现在公路运单的备注栏、海运提单的显著位置、铁路运单的"箱号"栏、以及多式联运提单的各段汇总中。

这意味着:集装箱号是你汇总四套单据时的天然锚点。手工汇总时,你会用集装箱号在四套单据之间做交叉核对——确保提单上的重量和铁路运单上的重量对得上、确保海运和铁路段运的是同一批货。在用AI提取后,这个核对过程自动完成:所有含同一个集装箱号的记录排列在相邻行,重量、件数的差异一目了然。

合同号同理——如果发货方给每票货分配了统一的合同号或PO编号,把这个字段加到列名中,四种运单只要有一份含有,提取结果就能建立跨文档关联。这种"跨文档数据关联合并"的能力,是多式联运单据提取区别于单类文档提取的核心价值。关于跨文档数据关联合并的更详细讨论,可以参考报关单AI提取中的跨单据核对案例——同样的逻辑适用于运单场景。

常见问题

四种运单混在一起上传,AI能自动区分是哪种运单吗?

能。AI在读取每一份文档时会理解其整体内容——它能看到"这是海运提单,因为上面有船名、航次、Port of Loading"或"这是铁路运单,因为上面有发站、到站、车次"。你不需要在文件名上标注,也不需要在上传前分类。如果你设了"运输方式"推断列,AI会额外输出这一判断。

铁路运单有中文也有英文,而且不同铁路公司的格式差很多,能准确提取吗?

可以。简录AI基于视觉大模型做语义理解,不依赖固定模板。中欧班列沿线的铁路运单——无论是中铁的国际货协运单(中文/俄文)、还是DB的德文运单——AI通过语义理解定位关键字段。字段名和语言的差异被语义理解层消解,不需要为每种语言或每种格式单独配置。不过,如果手写内容较多或运单印刷质量差,建议优先使用清晰扫描件。

多式联运提单本身已经汇总了全程信息,为什么还需要分别处理四套运单?

多式联运提单(Multimodal B/L)确实整合了全程信息,但它的数据粒度有限——通常只标了全程起点和终点,不会列出每段运输的具体承运人、实际发车/开船日期、以及各段的运单号。对于需要做分段运费核算、时效分析、或向不同承运人分别对账的团队来说,分段的运单数据不可替代。实际做法是:多式联运提单做整体对照,分段运单做业务操作,两张表互补。

如果一票货的运单超过一套(比如多个集装箱、多份提单),怎么汇总?

在上传时把同一票货的所有运单一起上传,批量处理后会全部汇总到同一张导出表中。你可以通过集装箱号或合同号分组查看——属于同一集装箱的记录会自然排列在相邻行。如果一票货用了三个集装箱,导出表中会是三组各四行的记录(每个集装箱四种运单),结构清晰。

是否支持从运单中提取港口代码(如SZX/HAM)并自动转换为中文地名?

简录AI会按文档原文提取——如果提单上写的是"Hamburg",提取结果就是"Hamburg"。如果你希望统一使用中文地名("汉堡"),可以在导出后在Excel中做一次查找替换,或者在列名中加入推断列规则让AI自动映射。当前版本不内置港口代码-中文名的自动转换表,但推断列可以覆盖这个需求。

多式联运"一单制"真正全面落地之前,四套单据分别处理仍是大多数企业每天的日常。与其等规则统一,不如让提取这一步先统一——把四种格式差异留给AI消化,你只拿统一格式的结果。

海运+铁路+公路运单,一张表统一提取

上传四套运单的照片或PDF,设定统一的列名(运输段、运输方式、承运人、集装箱号、品名等),简录AI自动识别并汇总到同一张Excel表。不分文档类型、不建模板,直接上传即可。

免费试用