Benchmark 豪掷 2450 万美金押注非结构化数据,打造 AI 时代文档处理新标准
2025-04-27 09:28
深思圈
2025-04-27 09:28
订阅此专栏
收藏此文章



当大多数企业还在为非结构化数据处理而苦恼时,一家成立仅两年的初创公司已经悄然解决了这一难题。Reducto 近日宣布完成由 Benchmark 领投的 2450 万美元 A 轮融资,使其总融资额达到 3300 万美元。这家由 MIT 校友创立的公司凭借其突破性的文档解析技术,已成为 Airtable、Scale AI 和多家 FAANG 企业的首选解决方案,每月处理数亿份文档。


Reducto 如何将传统计算机视觉与最新的视觉 - 语言模型 (VLM) 相结合,打造业内最精准的解析管道?其全新的 Agent OCR 框架如何让文档处理达到近乎完美的准确率?从文档解析到智能分类再到精准结构化提取,Reducto 正如何建立一个端到端的非结构化数据处理平台?


本文深入探讨这家初创公司的技术创新、商业策略以及它如何帮助企业在 AI 时代充分释放数据价值。



从魔法咒语到 AI 精准解析:Reducto 的创新之路


"我们有这样一个概念,想要为开发者构建魔法般的工具,"Reducto 的联合创始人兼 CEO Adit Abraham 说。"我们有一个与魔法相关的名字列表。Reducto 是其中之一,我们选择了它。奇怪的是,它确实符合我们所做的事情,但这完全是无意的。"


Reducto 这个名字源自《哈利·波特》中的一个咒语,用于将物体爆破成更小的碎片,甚至是尘埃。这正是 Reducto 所做的事情的一个版本——这家初创公司专注于文档摄入,处理大型、复杂的文档并准确地解析它们。


"人们最终选择使用我们的主要原因是准确性,"Abraham 向《财富》杂志表示。"我们采用多次传递方法,不仅输出结果,还能发现错误。"


2023 年成立的 Reducto 最近获得了由 Benchmark 领投的 2450 万美元 A 轮融资。First Round Capital、BoxGroup 和 Y Combinator 等现有投资者参与了这轮融资,使公司的总融资额接近 3300 万美元。(Reducto 由 First Round 领投的 840 万美元种子轮融资发生在 2024 年 10 月。)


这两位创始人 Adit Abraham 和 Raunak Chowdhuri 在 MIT 读书时相识,并分别在 Google 和 Nvidia 积累了 AI 经验。他们还利用自己在计算机视觉方面的经验构建了 Reducto,开发出能够理解手写、复选框和其他细微标记的技术。在某种意义上,Abraham 说,这些模型能够像人类一样"看到"文档,这也表明了我们整体发展的方向。



真实世界中的 AI 困境:非结构化数据的挑战


AI 在现实世界中产生影响意味着要处理杂乱的真实世界数据。Reducto 团队亲眼目睹了这个问题,并于去年着手构建业内最准确的解析管道——利用传统计算机视觉和新型视觉 - 语言模型 (VLM) 的优势——帮助公司将最复杂的文档转化为精确的、适合大语言模型 (LLM) 的输入,达到最先进的准确性。


First Round 的合伙人 Liz Wessel 表示,Reducto 的市场广阔且增长迅速:"金融、医疗、科技和法律等行业始终面临着将复杂文档转换为 LLM 精确输入的挑战,"她通过电子邮件表示。


Benchmark 普通合伙人 Chetan Puttagunta 通过电子邮件补充道:"对于大型财富 500 强公司,他们的大部分会计和财务流程仍然使用纸质文件完成——纸质支票、纸质确认单、发票。这些工作流程无法数字化,无法启用 AI,除非底层文档被准确处理,以供 LLM 使用。"


对于为企业服务的 AI 初创公司,Puttagunta 补充说:"他们的客户要求他们能够在客户当前的状态下与之会面——这意味着他们必须能够智能地处理文档。"



Agent OCR:多次传递的文档处理新范式


Reducto 自成立以来就设计了准确、可靠且可扩展的解析管道。他们不懈地改进它,以应对文档场景中具有挑战性的长尾问题——扩展对新文件类型的支持,处理方程式等复杂结构,并通过精确的边界框确保一致的现实世界可靠性。


如今,Reducto 发布了两个关键改进,使其解析管道更加完善:


1. Agent OCR 框架:这是文档处理领域的一次重大变革。这种基于代理的方法自动审查 Reducto 的输出,通过多次传递 VLM 框架捕捉错误并进行修正,类似于人在循环中的过程。Reducto 计划继续扩展这个框架,帮助客户在处理最具挑战性的文档时实现近乎完美的解析准确性。


2. 简单页面的智能成本节约:他们更新了管道,自动为可以在不牺牲保真度的情况下准确解析的简单页面提供折扣。在零准确性损失的情况下,Reducto 现在将处理简单页面的成本降低了一半,使客户始终能够受益于一流的准确性,而无需为不同复杂度维护单独的管道。


AI 合规独角兽 Vanta 一直在使用 Reducto 为多种客户体验提供支持。Vanta AI 工程高级经理 Ignacio Andreu 通过电子邮件表示,该产品准确且具有粘性:"根据我们的评估,像 Gemini 模型这样的替代品,虽然可能更便宜,但在准确性上尚未能与 Reducto 匹敌,"他告诉《财富》杂志。



从解析到端到端工作流:构建生产级文档管道


解析只是第一步。许多公司已经在利用 Reducto 的 API 端点构建用于智能分割和结构化提取的端到端管道。


Reducto 很快将推出一个新平台,通过将 Reducto 的所有模型——解析、分割、分类和提取——集成到一个统一、易于管理的解决方案中,将这种能力进一步发展,从而实现复杂的工作流程。


随着越来越多的公司寻求使用 AI 加速工作的方法,Reducto 团队期待推出一个用户友好的界面,任何人都可以使用它来自动化数据处理和管道构建。


该公司的客户包括 Airtable、Scale 和一家未披露的财富 10 强公司。Reducto 已经与各行业的一些最大型企业公司合作——金融、医疗、科技和法律——解析超过 2.5 亿页文档,帮助解决其 AI 团队的关键瓶颈。


像 Vanta 和 Airtable 这样的公司信任 Reducto 安全准确地从大量文档中提取见解——推动更智能的自动化并增强其产品。



投资者的信任:Benchmark 领投的成长故事


Reducto 有幸与一群出色的投资者合作,横跨种子轮和 A 轮融资。这轮融资由 Benchmark 领投,现有投资者 First Round Capital、BoxGroup 和 Y Combinator 参与其中,使总融资额达到 3300 万美元。


对于 Benchmark 来说,投资 Reducto 代表了对文档处理市场广阔前景的认可。Puttagunta 强调了 Reducto 解决方案的广泛适用性,不仅对大型企业,也对为这些企业服务的 AI 初创公司至关重要。


First Round 的 Wessel 同样看好 Reducto 的市场潜力,特别是在金融、医疗、科技和法律等行业,这些领域持续面临复杂文档处理的挑战。


这轮融资将帮助 Reducto 服务更多团队,不断改进其产品。Reducto 最初专注于文档的视觉模型,随后扩展为提供跨所有企业文件类型的最先进解析,并将很快使任何人都能够创建和构建跨所有用例的功能完整的处理管道。



未来展望:小型日常魔法的一步


"对于我这一代的科技人来说,这是迄今为止最具变革性的时期,"Abraham 说。"我们离拥有智能系统——或者代理,无论你想叫它什么——对每个重要流程进行推理不远了,从医生的办公室接待,到你的财务记录,保险索赔,所有这些。"


简而言之,这是朝着小型日常魔法迈出的一步。


Reducto 正瞄准一个明确的目标:成为利用非结构化数据的端到端平台。建立在其行业领先的解析能力基础上,他们已经扩展了支持,以支持综合工作流程——包括文档分割、智能分类、精确结构化提取等等。他们即将推出的平台将整合所有这些功能,帮助任何企业利用其非结构化数据构建准确的管道。


随着企业继续努力将真实世界的文档转化为可供 AI 使用的数据,Reducto 的解决方案将变得越来越重要。他们的多步骤方法,不仅提取内容而且识别错误,使他们在文档处理领域处于领先地位,提供了一种新的方法来处理传统上对 AI 系统来说最具挑战性的数据类型之一。


通过这轮融资,Reducto 正准备加速其使人类数据适合 LLM 使用的使命,并开启其增长的下一阶段。对于那些正在寻求在 AI 驱动的世界中充分利用其非结构化数据的企业来说,Reducto 正在提供一种魔法般的解决方案——将混乱的文档转化为有价值的洞察。



结尾


最后交个朋友,我自己是一个连续创业者,并在过去两年担任了 25+ 产品的海外增长顾问,现在准备全职 All-In 入场创业,我给自己定位是 COO 的角色,希望能够找到合适的 CEO 和 CTO,感兴趣一块合作的朋友欢迎加我微信(公众号后台回复【微信】)一块交流!



点击看我介绍我的新书也即将出版,跟我合作过的朋友应该都知道,我是一个特别落地的人,所以这本书的核心也是实用主义,没有任何空洞的理论和套话。因为我一直在一线做事,所有的内容也都是从我过去的实战经验中总结而来,以终为始,从结果出发。写这本书的目的也是希望能够帮助更多出海的朋友,快速把产品出海落地干起来,感兴趣的朋友可以关注一下哈


也欢迎大家留言讨论,分享你的观点!


觉得内容不错的朋友能够帮忙右下角点个赞,分享一下。您的每次分享,都是在激励我不断产出更好的内容。


欢迎关注深思圈,一起探索更大的世界。


- END -


往期文章

两个“特别坑”的 AI 产品创业方向,你知道吗



国内出海团队一定要补的一个短板是什么?

从 0 到 1 再到 10,最系统的 GTM 打法指南



【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

深思圈
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开