2025年1月8日,清华大学智能产业研究院(AIR)兰艳艳教授与哥伦比亚大学、卡内基梅隆大学合作的论文“A foundation model of transcription across human cell types”在Nature正式发表。 该工作起源于2021年由创新工场和AIR共同举办的DeeCamp2021人工智能训练营,兰艳艳教授指导GeneBert团队(组长莫申童是美国卡内基梅隆大学计算机专业硕士,组员包括美国哥伦比亚大学生物信息学博士傅熙、香港中文大学计算机专业博士洪晨洋和陈以真、华东师范大学计算机专业硕士郑雨轩)开发了泛化性能好、可迁移的多模态深度预训练模型,扩大建模范围至功能性非编码区,融入多种非编码调控区域之间的交互作用,实现了非编码区域基因突变预测的良好效果,最终获得大赛“双冠王”。 根据染色体可及性(chromatin accessibility)参与转录调控的生物学知识, 团队设计了能够尽量压缩有效信息且保持可解释性的转录调控元件,并得以通过大量细胞特异的ATAC-seq数据获取数百倍于单个基因组的数据。
购买咨询
400-9696-311 转1
问题咨询
400-9696-311 转2
商务合作
400-9696-311 转3
投诉及建议
400-9696-311 转4
关注摩熵医药公众号
随时查阅行业资讯
摩熵医药数据小程序
掌上数据查询系统








浙公网安备33011002015279
本网站未发布麻醉药品、精神药品、医疗用毒性药品、放射性药品、戒毒药品和医疗机构制剂的产品信息
收藏
登录后参与评论
暂无评论