
他们用科研“整活”,也能改写未来!
近日,第五届“上海科技青年35人引领计划”(U35)揭晓35位入选者和15位提名奖得主。在AI、生物医药、量子信息、低碳能源等前沿交叉领域,他们敢想、敢做、敢于挑战。
上海科技推出U35系列专题,走近这些“90后”科技人才。听他们讲讲科研里的B面人生,看他们如何定义下一轮创新潮汐的起点。

@何聪辉(上海人工智能实验室)
上海人工智能实验室青年科学家,长期深耕高性能计算与AI数据基础设施的交叉前沿,致力于构建面向通用人工智能的下一代数据基座。在计算机科学顶级会议上发表论文逾150篇,曾获戈登·贝尔奖(高性能计算应用最高奖)等多项国际顶级荣誉。其打造的智能文档解析引擎Miner U,发布一年斩获5万GitHub星标,其中OmniDocBench作为唯一中国团队成果获Gemini3.0官方收录验证;此外,他构建了大模型开放数据平台OpenDataLab,已为全球100多个国家提供400万次数据服务,为AGI(通用人工智能)的演进筑牢了关键的数据基石。

世界科技前沿
在人工智能高速发展的当下,数据和算力已成为驱动创新的关键资源。然而,如何将海量杂乱的数据转化为大模型真正可理解、可学习的内容,让AI真正看懂人类世界,却是行业面临的核心议题。
对此,上海人工智能实验室青年科学家何聪辉提出一个生动的比喻:“我们的工作,就像在人工智能领域搭建一座‘超级炼油厂’。”他将互联网与人类文明中的海量原始数据比作“原油”,而AI大模型则是高性能“发动机”,“如果把充满杂质的原油直接倒进这样一个精密的机器,大模型就会跑不起来,甚至坏掉。”何聪辉解释道。
为了将多模态的数据“原油”,提炼为AI可读的高质量“燃料”,何聪辉带领团队采用“AI自动化清洗数据”的思路,通过引入高性能计算技术,构建了可快速处理千亿级规模的数据基座,“让大模型跑得更快、更准,也让真正AI-Ready的数据对训模型、用模型的人触手可及。”
基于这一强大数据基座,上海人工智能实验室还开源了“书生”系列大模型,走通了“通专融合”的技术路径。系列模型不仅具备通用推理与多模态理解能力,更在生命科学、物质科学等专业领域展现出超越一般模型的深度认知与解题能力,真正实现了以高质量数据驱动前沿创新。
@上海科技
@何聪辉
@上海科技
@何聪辉
@上海科技
@何聪辉
@上海科技
@何聪辉
@上海科技
@何聪辉

企业及专家观点不代表官方立场
作者:朱文莹
拍摄、后期:Gina.Z




↓分享
↓点赞

↓在看












川公网安备51019002008863号
本网站未发布麻醉药品、精神药品、医疗用毒性药品、放射性药品、戒毒药品和医疗机构制剂的产品信息
收藏
登录后参与评论
暂无评论