洞察市场格局
解锁药品研发情报

客服电话

400-9696-311
医药数据查询

Nature|清华大学智能产业研究院兰艳艳团队:跨人类细胞类型转录的基础模型

哥伦比亚大学 清华大学 细胞
2025年1月8日,清华大学智能产业研究院(AIR)兰艳艳教授与哥伦比亚大学、卡内基梅隆大学合作的论文“A foundation model of transcription across human cell types”在Nature正式发表。 该工作起源于2021年由创新工场和AIR共同举办的DeeCamp2021人工智能训练营,兰艳艳教授指导GeneBert团队(组长莫申童是美国卡内基梅隆大学计算机专业硕士,组员包括美国哥伦比亚大学生物信息学博士傅熙、香港中文大学计算机专业博士洪晨洋和陈以真、华东师范大学计算机专业硕士郑雨轩)开发了泛化性能好、可迁移的多模态深度预训练模型,扩大建模范围至功能性非编码区,融入多种非编码调控区域之间的交互作用,实现了非编码区域基因突变预测的良好效果,最终获得大赛“双冠王”。 根据染色体可及性(chromatin accessibility)参与转录调控的生物学知识, 团队设计了能够尽量压缩有效信息且保持可解释性的转录调控元件,并得以通过大量细胞特异的ATAC-seq数据获取数百倍于单个基因组的数据。
<END>
*版权声明:本网站所转载的文章,均来自互联网,旨在传递更多信息。鉴于互联网的开放性和文章创作的复杂性,我们无法保证所转载的所有文章均已获得原作者的明确授权。如果您是原作者或拥有相关权益,请与我们联系,我们将立即删除未经授权的文章。本网站转载文章仅为方便读者查阅和了解相关信息,并不代表我们认同其观点和内容。读者应自行判断和鉴别转载文章的真实性、合法性和有效性。
AI+生命科学全产业链智能数据平台

收藏

发表评论
评论区(0
  • 暂无评论

    摩熵医药企业版
    50亿+条医药数据随时查
    7天免费试用
    摩熵数科开放平台
    原料药
    十五五战略规划

    全球新药治疗领域统计

    全球新药靶点统计

    专利数据服务
    添加收藏
      新建收藏夹
      取消
      确认