
当全世界还在计算大模型参数、上下文长度和推理成本时,杨立昆选择把赌注押向另一个方向。
2026年3月,Advanced Machine Intelligence Labs,简称 AMI Labs,宣布完成 10.3亿美元种子轮融资,投前估值达到 35亿美元。这家公司由图灵奖得主、前 Meta 首席 AI 科学家 杨立昆(Yann LeCun)领衔,CEO是连续创业者亚历山大·勒布伦(Alexandre LeBrun)。
AMI 的目标不是再造一个 ChatGPT,而是构建一种更接近真实世界智能的 AI 系统:world models,世界模型。
这笔融资的金额已经足够夸张。对一家刚成立、尚未推出成熟商业产品的研究型AI公司来说,10亿美元级别的种子轮,几乎意味着资本在为一种技术路线提前下注。更关键的是,AMI并没有把自己包装成通用大语言模型公司。它的核心判断很直接:今天的AI已经学会了语言,但还没有真正学会世界如何运行。
在杨立昆看来,大语言模型擅长从文本中预测下一个词,却缺乏稳定的物理直觉、长期记忆、因果推理和行动规划能力。它可以写病历摘要、生成代码、回答医学问题,却很难像人类一样持续理解一个环境的状态变化,并预测“如果我这样做,接下来会发生什么”。
这正是AMI Labs 想要切入的地方。

01 LLM的天花板:会说话,不等于理解世界
过去几年,AI产业几乎被大语言模型重新定义。ChatGPT让自然语言成为人机交互的默认入口,Claude、Gemini、Llama等模型推动企业应用迅速扩散。医疗、金融、教育、软件开发、客服、营销,几乎每个行业都开始尝试把LLM嵌入工作流。
但LLM的强大也暴露了一个底层问题:它主要是在语言世界中学习。
语言是人类经验的压缩结果,但语言不等于世界本身。一个模型可以从海量文本中学会“杯子从桌上掉下来会摔碎”,却未必真正掌握重力、材质、运动轨迹、碰撞后果和行动约束。它可以解释手术流程,却不能像一名资深医生那样持续追踪患者状态、判断病情演变,并在风险边界内选择下一步动作。
这也是为什么LLM在高风险行业始终存在信任门槛。医疗尤其典型。临床场景不只需要“生成正确文本”,还需要系统理解病情如何随时间变化、检查结果之间如何相互影响、治疗动作可能带来什么后果,以及什么时候必须停下来交给医生判断。
AMI的立场不是简单反对语言模型,而是认为仅靠语言模型无法抵达真正的自主智能。下一代AI需要的不只是更流畅的表达,而是对真实世界状态的理解、预测和规划。
02 世界模型:给AI装上“内部模拟器”
世界模型这个词并不新。强化学习、机器人、自动驾驶和认知科学里,都长期讨论过类似概念。简单说,世界模型就是一个系统对外部世界运行规律的内部表征。
人类每天都在使用世界模型。你看到一辆车快速驶来,会预测它几秒后到达路口;你端起一杯热水,会自然调整手部动作;医生看到一组异常指标,会推演患者接下来可能恶化的方向。这些判断并不是语言推理的结果,而是大脑在持续模拟世界状态。
AMI想做的,是让AI拥有类似能力。
按照AMI的方向,它要开发能够从真实世界传感器数据中学习抽象表征的世界模型。这类模型会忽略大量不可预测、无关紧要的细节,在表征空间中进行预测。进一步说,AMI强调 action-conditioned world models,也就是“以行动为条件的世界模型”:系统不只预测世界自然会怎样变化,还要预测自己的行动会带来什么后果,并据此规划完成任务的动作序列,同时受到安全边界约束。
如果说LLM的基本动作是“根据上下文生成下一个token”,世界模型的基本动作则是:根据当前状态和可能行动,预测未来状态。
前者更适合语言、知识和信息处理,后者更接近机器人、自动化系统、医疗监测、工业控制和真实世界智能体。
换句话说,LLM让AI进入办公室;世界模型试图让AI进入现实世界。
03 JEPA路线:不预测像素,而预测世界结构
AMI的技术路线绕不开杨立昆长期倡导的 JEPA,即 Joint Embedding Predictive Architecture,联合嵌入预测架构。
JEPA的关键思想,是不要让模型逐像素预测世界。真实世界充满随机性和不可预测细节。比如一段视频里,树叶如何晃动、光影如何微小变化、背景里某个人下一秒眨不眨眼,这些细节对智能体行动通常没有意义。如果模型把算力浪费在复原每一个像素,它学到的可能是表面纹理,而不是对世界有用的结构。
JEPA选择在抽象表征空间里进行预测。模型看到一部分输入后,不是生成完整图像,而是预测被遮挡部分在高层语义表征中的状态。这样它更关注物体、关系、运动、因果和任务相关信息。
这一路线容易被误解成“视觉模型”。原因是Meta过去推出的I-JEPA、V-JEPA、V-JEPA 2都以图像和视频为主要展示载体。但JEPA更底层的价值,其实不在“看图”,而在 预测状态。
视频只是时间序列的一种。真正重要的是,世界不是静态图片,而是一条连续变化的状态流。机器人手臂的关节角度、自动驾驶车辆周围的交通参与者、工业设备的振动和温度曲线,本质上都是时间序列。一个智能系统如果不能理解“现在的状态从哪里来、接下来会往哪里走、我的动作会如何改变这条轨迹”,它就只能停留在识别和描述层面。
因此,AMI的世界模型不能只理解为空间智能或视觉智能。它更接近一种面向动态系统的底层建模能力:把多模态输入转化为连续状态表征,在时间维度上预测演化,在行动维度上评估后果。

04 时间序列:世界模型真正的底层语法
如果把世界模型拆到最底层,它处理的不是图像,而是时间。
人类理解世界,靠的不是某一帧画面,而是对连续变化的把握。一个机器人完成抓取动作,看的不是单张图片,而是目标物体、手臂、力反馈和环境之间连续变化的关系。自动驾驶系统判断是否变道,也不是识别某一刻的车辆位置,而是理解车流、速度、意图和道路结构在几秒钟内如何演化。
这正是时间序列模型的重要性。
传统时间序列模型擅长预测数值曲线,比如销量、温度、设备故障概率。但它们往往局限在单一数据类型或特定任务里。世界模型要做的是更高一层:把视频、传感器、文本、动作、事件和环境反馈统一成状态序列,并在抽象空间里预测未来。
我们以医疗场景举例,医疗数据本身并不是静态表格,而是患者状态随时间不断变化的轨迹。一次问诊、一张影像、一份化验单、一段可穿戴数据、一次用药调整,单独看都只是片段;放进时间线上,才构成真正有意义的病程。
今天很多医疗AI仍停留在“截面判断”:给一张影像判断病灶,给一段对话生成病历,给一份病历提取结构化字段。但临床真正需要的是“纵向理解”:疾病如何进展,风险何时上升,治疗是否有效,患者什么时候需要升级干预。
从这个角度看,世界模型和时间序列不是两个话题。世界模型的核心能力,正是对复杂时间序列的抽象、预测和干预规划。

05 十亿美元种子轮:资本押注“后LLM时代”
AMI Labs这轮融资之所以值得关注,不只是金额大,而是投资方结构本身释放了信号。
领投方包括Cathay Innovation、Greycroft、Hiro Capital、HV Capital和贝索斯旗下Bezos Expeditions,参与方还包括英伟达、三星、淡马锡、Toyota Ventures、SBVA、法国国家投资银行Bpifrance旗下基金,以及达索、Publicis等法国本土产业资本。
这不是一组单纯追逐AI热度的财务投资人。
英伟达的出现,意味着AMI的路线与下一代AI算力和机器人基础模型有关。三星、丰田、SBVA背后连接的是硬件、消费电子、汽车、机器人和工业制造场景。Toyota Ventures长期关注自动驾驶、机器人和前沿制造,与世界模型的“行动智能”天然相关。
把这些线索放在一起看,这轮融资的信号不是“又一家AI公司融了大钱”,而是硬件、制造、算力、机器人、空间计算和全球产业资本,正在共同押注一个判断:AI下一阶段的增量,可能不再来自更会聊天的模型,而来自更会理解动态世界的模型。
杨立昆本人则是这场押注的核心信用来源。

他是深度学习三巨头之一,2018年与杰弗里·辛顿、约书亚·本吉奥共同获得图灵奖。更重要的是,他过去几年一直是LLM万能论的公开质疑者。他并不否认大语言模型的价值,但始终认为,单靠自回归文本预测无法抵达真正的智能。2022年,他在《A Path Towards Autonomous Machine Intelligence》中系统提出JEPA和世界模型路线,强调自监督学习、抽象表征、长期记忆、规划和能量模型。
AMI某种意义上是杨立昆把这套学术主张公司化。它不是从市场需求倒推出来的应用创业,而是一次由科学路线驱动的产业实验。
06 第一批战场:机器人、工业,也包括医疗
世界模型最自然的应用场景,是所有需要AI理解动态环境并采取行动的领域。
机器人是最直接的方向。今天的机器人已经可以通过视觉模型识别物体,通过语言模型理解指令,但真正困难的是连续行动:如何抓取不规则物体,如何在动态环境中避障,如何根据失败反馈调整动作,如何规划多步骤任务。没有世界模型,机器人很容易停留在“看懂”和“听懂”,却难以稳定地“做成”。
工业场景也类似。制造、能源、物流、航空、仓储等系统里,AI需要理解设备状态、环境变化、故障风险和动作后果。一个智能体如果要参与调度、维护或控制,就必须能预测不同操作路径的后果。单纯生成建议不够,系统必须知道“这样做会不会造成连锁风险”。
医疗也可以放进这个序列里看。医院不是静态数据库,而是一个高密度、多角色、强约束的动态系统。患者状态在变,医生决策在变,护理资源在变,药物反应在变,支付和合规规则也在变。如果AI只会根据病历生成一段文本,它只能改善局部效率;如果AI能理解患者状态的连续演化,并在安全边界内辅助规划下一步动作,它才有机会进入更核心的临床工作流。
这也解释了为什么AMI的第一个公开合作对象会是Nabla。
07 Nabla为何需要世界模型
AMI不是典型医疗AI公司,但医疗是最能检验世界模型价值的场景之一。
2026年,
Nabla在合作公告中提到,将优先接入AMI的世界模型技术,用于探索下一代安全、可审计的医疗智能体。这个表述很关键。
医疗AI的核心痛点从来不是“能不能生成文本”。今天的LLM已经能生成病历、总结对话、解释检查结果、回答患者问题。真正困难的是:系统如何知道自己理解的是不是完整病情?如何在多轮临床对话中保持状态记忆?如何判断某个建议会带来什么风险?如何在不确定时主动请求医生介入?如何让每一步判断都能被审计?
世界模型在医疗中的潜在价值,正是补上这些短板。
一个面向临床场景的世界模型,不一定要像机器人那样理解物理运动,但它需要理解临床状态如何演化。患者的症状、生命体征、实验室检查、影像结果、用药史、合并症和医生动作之间,本质上构成一个动态系统。AI如果只把它们当作文本片段处理,很容易在上下文窗口内做表面拼接;如果能构建患者状态的抽象模型,就有机会更稳定地预测风险、规划下一步信息收集、提示潜在冲突,并在安全边界内辅助临床决策。
这仍然是早期探索。AMI和Nabla目前披露的是战略合作,不是已经获批的临床产品。医疗场景对AI的要求远高于普通办公软件,任何涉及诊疗建议、分诊、用药、风险预测的功能,都需要临床验证、合规设计和责任边界。
但正因为门槛高,医疗才有观察价值。如果世界模型能在医疗里证明自己比LLM更适合长期状态建模、更容易审计、更能控制行动边界,它就不只是机器人或自动驾驶的底层技术,也可能成为下一代临床AI智能体的底座。

08 竞争格局:世界模型正在成为AI新主战场
AMI并不是唯一押注世界模型的公司。
李飞飞创立的World Labs围绕空间智能和世界模型展开,重点是让AI理解和生成3D世界。机器人领域的Physical Intelligence、Figure AI、Skild AI等公司,也都在探索让AI从真实交互数据中学习行动能力。自动驾驶公司、具身智能公司、大厂多模态团队,也都在以不同路径接近世界模型。
但如果只把竞争理解成“谁的视频模型更好”或“谁的空间重建更强”,仍然会低估这场竞争。
世界模型真正要解决的是动态系统建模。视觉只是入口之一,时间序列才是底层语法。机器人需要理解动作序列,自动驾驶需要理解交通流,工业系统需要理解设备曲线,医疗AI需要理解患者病程,金融风控需要理解风险传播。不同场景的数据形式不同,但共同点都是:状态随时间演化,行动会改变未来,预测错误会带来现实后果。
AMI的路线更鲜明地带有杨立昆的技术哲学:反对把AGI希望全部押在LLM规模化上,强调自监督学习、抽象表征、预测架构、长期记忆和可控规划。
这既是优势,也是风险。
优势在于差异化足够清晰。在大模型公司集体卷参数、算力、上下文和Agent工具调用时,AMI讲的是另一套底层叙事:真正的智能不是语言补全,而是世界建模。这让它在资本和人才市场中具备强烈识别度。
风险在于验证周期可能很长。LLM虽然有幻觉和推理缺陷,但已经证明了商业化价值。企业愿意为代码助手、客服、文档、搜索、销售自动化付费。而世界模型的产品形态还没有被完全定义。它到底会以API、机器人基础模型、行业仿真平台、自动化控制系统,还是某种Agent基础设施出现,仍不清晰。
更大的问题是,世界模型是否一定要独立于LLM路线。未来也可能不是“世界模型取代语言模型”,而是二者融合:LLM负责语言、知识和任务接口,世界模型负责状态理解、后果预测和行动规划。
Nabla与AMI的合作其实就暗示了这种方向。医疗AI不是扔掉LLM,而是在LLM之外增加更可靠的世界状态建模能力。
09 AMI的真正看点:不是产品,而是范式
如果用传统公司分析框架看AMI,很容易失焦。它没有清晰的收入数据,没有成熟产品矩阵,也没有已验证的大规模客户案例。按医疗AI公司的标准,它甚至不能算典型标的。
但AMI的价值不在当下产品,而在它提出了一个足够底层的问题:AI下一阶段的瓶颈,究竟是模型规模不够,还是架构方向不够?
如果答案是前者,行业会继续沿着更大模型、更多数据、更多算力、更长上下文往前走。今天的赢家大概率仍是OpenAI、Google、Anthropic、Meta、xAI,以及掌握算力和分发渠道的大厂。
如果答案是后者,AMI这样的公司就有机会成为新范式入口。世界模型一旦成立,它解决的不是某个垂直应用问题,而是智能系统如何理解、预测和行动的问题。这个问题比聊天、搜索、写作、代码生成更接近AI的长期目标。
医疗AI也在经历类似转折。第一阶段是信息抽取和文档生成,第二阶段是工作流自动化,第三阶段很可能是临床状态建模和可审计智能体。仅靠LLM,很难支撑第三阶段。临床需要的不只是生成答案,而是理解患者状态、预测风险、规划动作,并知道什么时候不能行动。
这正是AMI值得被医疗产业关注的原因。它今天还没有医疗产品闭环,却指向了医疗AI下一步真正需要补上的能力。
10 结语:AI的下一次跃迁,可能不是更大的语言模型
AMI Labs的10亿美元种子轮,看起来像AI资本泡沫中的又一个夸张故事。但放在产业演进里看,它代表的是一场更深的路线分歧。
过去几年,AI最大的突破来自语言。模型通过学习人类写下的一切,获得了惊人的表达、总结、推理和编程能力。但人类智能不只存在于语言中。更多时候,智能体现在我们对世界的直觉,对时间变化的感知,对行动后果的预判,以及在风险边界内做出连续决策的能力。
AMI押注的正是这一层智能。
它短期不会像ChatGPT一样迅速变成大众产品,也很难马上拿出医疗AI公司常见的客户数、ARR、FDA证书或临床试验结果。它更像一场长期基础设施赌局:如果世界模型路线成立,AI将从“会说话的工具”走向“能理解动态世界的行动系统”。
对医疗行业来说,最值得关注的不是AMI今天能做什么,而是它提出的问题足够准确:当AI进入真实临床世界,仅仅会生成病历和回答问题还不够。它必须理解状态、预测变化、约束行动,并把每一步判断留在可审计的轨道上。









川公网安备51019002008863号
本网站未发布麻醉药品、精神药品、医疗用毒性药品、放射性药品、戒毒药品和医疗机构制剂的产品信息
收藏
登录后参与评论
暂无评论