Exomiser
Exomiser 是一款开源的外显子/基因组变异优先级排序工具,可结合 VCF 变异、HPO 表型和遗传模式,帮助研究者筛选候选致病基因与变异。
30 秒判断
先看这四点,再决定要不要继续读完整评测。
Exomiser 的核心价值在于把变异注释、群体频率过滤、遗传模式推断和 HPO 表型相似度排序放在同一套可复现流程中。
最适合罕见病、先天畸形、神经发育障碍、遗传代谢病等疑似单基因病项目中的外显子/基因组测序候选变异优先级排序。
不适合把结果直接作为临床诊断报告的唯一依据,也不适合主要研究肿瘤体细胞突变、复杂病 GWAS、单细胞组学或大规模非编码调控变异解释的项目。

适合谁用
适合罕见病遗传学研究者、临床遗传诊断实验室、生信分析师、儿科/神经/遗传代谢病团队,以及需要把测序变异与患者表型联合分析的医学科研人员。
用它完成一个小范围科研试跑
先用低风险任务验证工具价值,再决定是否放进课题组主流程。
输入材料
一个真实但范围较小的科研任务
应该得到
可比较的结果、耗时记录、风险点和是否继续使用的判断
- 1选一个 30 分钟内能完成的小任务作为测试。
- 2记录输入材料、工具设置、操作步骤和输出结果。
- 3把结果和人工流程对照,判断节省了哪里、增加了哪里。
- 4只把通过核验的部分纳入长期工作流。
人工核验点
更适合
最适合罕见病、先天畸形、神经发育障碍、遗传代谢病等疑似单基因病项目中的外显子/基因组测序候选变异优先级排序。
不太适合
不适合把结果直接作为临床诊断报告的唯一依据,也不适合主要研究肿瘤体细胞突变、复杂病 GWAS、单细胞组学或大规模非编码调控变异解释的项目。
数据与隐私
Exomiser 通常在本地或机构服务器运行,分析过程不要求把 VCF 或患者表型上传到第三方网站。用户仍需按所在医院或课题组规范管理可识别遗传数据,控制访问权限,记录数据库版本,并在跨机构共享结果前完成必要的脱敏和伦理审批。
医学科研场景
- 疑似罕见遗传病患者外显子测序后的候选致病基因排序与病例讨论准备。
- 三联体测序中筛选符合 de novo、隐性遗传或 X 连锁模式的候选变异。
- 对既往未诊断病例进行再分析,结合新增 HPO 表型和更新数据库重新评估候选基因。
相关科研场景
查看全部场景核心功能
使用场景
优点与局限
优点
- +能把患者表型信息纳入变异优先级排序,比单纯按频率和功能影响过滤更适合罕见病研究。
- +开源并可本地运行,适合处理不便上传的临床基因组数据,便于纳入机构内部分析流程。
- +输出结果包含候选基因、变异影响、频率、表型匹配等信息,方便后续人工解读和多学科讨论。
- +可通过配置文件固化分析参数,有利于批量样本处理和研究流程复现。
局限
- -安装和数据库配置需要一定生信经验,初次部署可能耗时,且需要较大的本地存储空间。
- -结果质量依赖 VCF 质量、HPO 表型标注准确性和所使用数据库版本;表型录入过粗会影响排序。
- -不能直接给出临床诊断结论,仍需依据 ACMG/AMP 框架、家系验证、文献证据和临床复核进行解释。
- -
快速上手
确认分析目标:准备外显子或基因组测序生成的 VCF 文件,并明确是单例、二联体还是三联体/家系分析。
安装与配置:从 Exomiser GitHub 或官方文档获取程序包,按说明配置 Java 环境、参考基因组版本和所需数据库。
整理表型:将患者临床表现转换为 HPO 术语,尽量记录关键阳性表型,也注意排除明显不相关或不确定的描述。
编写配置文件:指定输入 VCF、样本关系、遗传模式、参考基因组版本、输出路径和过滤参数。
审阅结果:运行命令行分析后查看 HTML 或 TSV 报告,结合变异证据、家系信息、文献和临床资料进行二次解读。
详细介绍
这个工具解决什么问题
Exomiser 面向外显子测序和基因组测序后的变异筛选问题。医学科研项目中,一个病例的 VCF 往往包含大量变异,研究者需要判断哪些变异更可能解释患者表型。
传统做法通常先按群体频率、功能影响和已知数据库过滤,再人工查文献。这个过程可行,但在罕见病、表型复杂或家系信息有限的情况下,容易耗费大量时间。
Exomiser 的特点是把 变异注释、遗传模式 和 HPO 表型匹配 放在同一个排序框架中。它不是单纯告诉你某个位点是否有害,而是帮助你把候选基因和候选变异按优先级排列。
对临床医生和 PI 来说,它的价值在于缩小人工解读范围;对生信人员来说,它提供了可配置、可批量运行、可记录版本的分析流程。最终结果仍需要人工复核,而不是直接等同于诊断。
适合的医学科研场景
Exomiser 最适合用于疑似单基因病、罕见病和家系测序研究。例如新生儿疑难遗传病、儿童神经发育障碍、遗传代谢病、先天畸形综合征,以及表型较明确但常规基因检测阴性的病例。
如果研究团队已经有外显子测序 VCF,并且能整理出较可靠的 HPO 术语,Exomiser 可以把患者表型与基因-疾病-表型知识库联系起来,从而优先呈现更符合临床表现的基因。
在三联体分析中,研究者可结合父母和患儿的基因型,筛选 de novo、复合杂合、纯合或 X 连锁候选变异。对于准备病例报告、候选基因研究或遗传病队列分析的团队,这类排序结果很有帮助。
- 用于疑似罕见病单例或家系外显子测序后的候选基因筛选。
- 用于未诊断病例再分析,结合更新后的数据库和补充表型重新排序。
- 用于遗传病队列研究中批量生成候选变异列表,便于后续人工审核。
- 用于多学科讨论前整理候选基因、变异证据和表型匹配依据。
不适合的情况
Exomiser 并不是所有医学测序项目的通用答案。若研究对象是肿瘤体细胞突变、克隆演化、免疫组库、病原宏基因组或单细胞转录组,通常应选择更针对这些数据类型的工具。
如果项目重点是全基因组测序中的深度非编码调控变异、复杂结构变异或多基因风险评分,Exomiser 的输出可能只能覆盖其中一部分问题。此时需要联合 SV caller、调控注释、连锁分析或统计遗传学工具。
此外,若临床表型无法较好映射为 HPO 术语,或者样本关系、测序质量和 VCF 质控存在明显问题,排序结果会受到影响。表型输入越粗略,候选基因排序越可能偏离真实原因。
Exomiser 更像是“候选优先级排序器”,不是“自动诊断器”。它能提高筛选效率,但不能替代临床遗传学解释、家系验证和实验功能验证。
输入、输出与工作流程
典型输入包括 VCF 文件、样本信息、遗传模式设定、参考基因组版本和 HPO 表型列表。团队应确保 VCF 经过基本质控,例如覆盖度、基因型质量和样本对应关系检查。
HPO 术语是 Exomiser 工作流中的重要信息。建议由熟悉病例的临床医生或遗传咨询人员参与整理,优先记录特异性强、相对稳定、与疾病相关性高的表型。
运行时通常通过配置文件控制参数,例如频率阈值、疾病模型、样本性别、家系关系和输出目录。对批量项目而言,固定配置文件并记录数据库版本,有助于保证分析可复现。
输出报告常包含候选基因排序、候选变异、预测影响、群体频率、疾病关联和表型匹配信息。研究者可以先查看靠前候选,再回到原始测序证据、家系基因型和临床资料中验证。
| 环节 | 研究者需要关注 |
| VCF 输入 | 样本是否正确、基因型质量是否可靠、参考基因组版本是否匹配 |
| 表型输入 | HPO 术语是否准确,是否遗漏关键阳性表型 |
| 参数设置 | 遗传模式、频率阈值和输出格式是否符合研究问题 |
| 结果解读 | 是否结合 ACMG/AMP、家系验证、文献和临床复核 |
结果解读与质量控制建议
Exomiser 排名靠前的结果应被视为优先审阅对象,而不是最终结论。对于临床相关研究,仍需按照 ACMG/AMP 变异解释框架评估致病性,并记录证据来源。
建议重点检查候选变异是否符合疾病遗传模式、是否与患者主要表型一致、是否存在可解释的家系共分离证据。对于新发变异,还要确认父母样本关系和变异读段证据。
对论文或课题数据而言,应保留软件版本、数据库版本、参考基因组、过滤参数和 HPO 术语列表。这样在审稿、复现或后续再分析时,团队可以清楚说明候选基因如何得到。
如果 Exomiser 未找到合理候选,不代表不存在遗传原因。可能原因包括测序覆盖不足、结构变异未被捕获、非编码变异、表型录入不充分、数据库尚未收录相关基因,或疾病并非单基因机制。
数据隐私与部署注意事项
Exomiser 通常在本地电脑、实验室服务器或医院内网环境中运行,不需要把患者 VCF 和表型资料上传到在线平台。这一点对处理临床遗传数据的团队较为重要。
不过,本地运行并不自动等于合规。VCF 属于高度敏感的遗传信息,研究团队仍应限制访问权限,规范文件命名,避免在公开目录、个人网盘或未授权服务器上存放可识别数据。
在跨机构合作中,建议仅共享必要的脱敏结果,并遵循伦理审批和数据使用协议。若需要共享候选变异表,也应谨慎处理样本编号、家系关系和罕见表型组合等可能造成再识别的信息。
总体而言,Exomiser 适合作为遗传病测序分析流程中的一个重要环节。它能帮助研究者更系统地结合变异和表型,但最佳实践仍是由生信、临床遗传、相关专科医生共同完成解释。
替代选择
如果 Exomiser 不适合你,可以考虑:
同类工具推荐
如果你需要更完整的文献工作流
从检索到精读,一站完成
这个工具适合特定场景。如果你需要中文检索、实时翻译、AI 辅助精读,可以试试超能文献。
了解超能文献