seqr
seqr 是基因组变异分析和协作解读平台,适合罕见病、家系分析和候选变异筛选。
30 秒判断
先看这四点,再决定要不要继续读完整评测。
seqr 为罕见病基因组数据分析提供了一个集成平台。
最适合把测序变异、家系信息、候选基因和团队注释放在同一个协作流程里。
不适合没有遗传学和变异解读经验的用户独立做临床结论;医学解释需要专家复核。
访问GitHub仓库:访问 https://github.com/broadinstitute/seqr 获取最新代码和官方文档。
最适合把测序变异、家系信息、候选基因和团队注释放在同一个协作流程里。
不适合没有遗传学和变异解读经验的用户独立做临床结论;医学解释需要专家复核。
DeepVariant / VEP / ClinVar

适合谁用
适合做遗传病、罕见病、WES/WGS 变异解读和多学科协作的科研团队。
用它完成一个小范围科研试跑
先用低风险任务验证工具价值,再决定是否放进课题组主流程。
输入材料
一个真实但范围较小的科研任务
应该得到
可比较的结果、耗时记录、风险点和是否继续使用的判断
- 1选一个 30 分钟内能完成的小任务作为测试。
- 2记录输入材料、工具设置、操作步骤和输出结果。
- 3把结果和人工流程对照,判断节省了哪里、增加了哪里。
- 4只把通过核验的部分纳入长期工作流。
人工核验点
- 是否真的节省时间
- 是否增加隐私或版权风险
- 是否能被团队其他成员复用
更适合
最适合把测序变异、家系信息、候选基因和团队注释放在同一个协作流程里。
不太适合
不适合没有遗传学和变异解读经验的用户独立做临床结论;医学解释需要专家复核。
数据与隐私
seqr是一个开源的自部署平台。这意味着所有数据都存储在用户自己的服务器上,用户拥有对数据的完全控制权。数据隐私和安全性完全取决于用户的IT基础设施和管理策略。Broad Institute作为开发者,不会访问或存储用户数据。用户需自行确保符合相关数据保护法规(如GDPR、HIPAA)。
医学科研场景
- 罕见病变异过滤
- 家系分析
- 候选基因协作
- 变异解读
相关科研场景
查看全部场景快速上手
访问GitHub仓库: 访问 `https://github.com/broadinstitute/seqr` 获取最新代码和官方文档。
阅读部署指南: 仔细阅读 `docs/` 目录下的安装和部署文档,了解系统架构和依赖项,包括Docker或Python环境、PostgreSQL数据库等。
环境配置: 根据文档指引,配置所需的软件环境和硬件资源。推荐使用Docker进行部署,以简化依赖管理。
数据导入: 准备您的VCF、BAM等基因组测序数据,并按照seqr的规范进行数据预处理、导入和索引。这通常涉及运行特定的命令行脚本。
启动Web服务并登录: 启动seqr的Web服务,通过浏览器访问指定URL,创建用户账号后即可开始上传项目和分析数据。
详细介绍
seqr 适合变异解读协作,不是单独的变异检测工具
seqr 排名还靠后,当前更适合补足页面语义和内链。它应该被解释成变异解读和协作平台,而不是 DeepVariant 这样的 calling 工具。
- 流程位置:位于变异检测、注释和质控之后,用来筛选、协作和解释候选变异。
- 适合团队:遗传病、罕见病、家系分析和跨角色协作解读。
- 边界:候选变异需要结合表型、文献、数据库和专家判断。
相关入口:DeepVariant 工具页、生信组学工具专题。
seqr:罕见病基因组数据分析的核心工具
在医学科研领域,尤其是罕见病研究中,基因组测序数据分析的复杂性常常构成诊断和研究的瓶颈。面对数以百万计的遗传变异,如何高效、准确地筛选出与疾病相关的致病变异,是临床医生和科研人员面临的共同挑战。传统的分析流程往往依赖于多个独立的命令行工具和复杂的脚本,对生物信息学专业知识要求较高,且难以实现团队间的有效协作。
由Broad Institute开发的开源平台 seqr 正是为了解决这一痛点而生。它提供了一个基于Web的交互式界面,旨在将繁琐的基因组变异解读流程整合到一个统一的平台中。通过 seqr,用户可以直观地对全外显子组测序(WES)或全基因组测序(WGS)数据进行变异筛选、注释、可视化和解读,从而加速罕见病病因的探索和临床诊断的辅助。
seqr 的设计理念是将复杂的生物信息学分析封装起来,通过用户友好的界面呈现,使得非生物信息学背景的临床医生和遗传学研究者也能参与到基因组数据的深度分析中。这不仅提升了分析效率,也促进了多学科团队在罕见病研究中的紧密合作。
核心功能与医学科研应用
seqr 平台集成了多项关键功能,使其在罕见病基因组分析中表现出较强的实用性:
- 强大的变异筛选与过滤引擎: 用户可以根据基因、变异类型(如错义突变、无义突变)、等位基因频率(来自gnomAD、ExAC等公共数据库)、预测效应(如SIFT、PolyPhen)以及表型信息等多种条件,灵活地对变异进行多维度过滤,快速缩小候选变异范围。
- 直观的多样本与家族系可视化:
seqr能够清晰展示多个样本或家族成员的基因型信息,包括家系图谱,这对于识别常染色体隐性、显性或X连锁遗传模式至关重要。它还集成了基因组浏览器(如IGV),允许用户直接在Web界面中查看原始测序数据(BAM文件)。 - 丰富的变异注释集成: 平台自动整合了来自ClinVar、dbSNP、gnomAD等权威公共数据库的变异信息,包括临床意义、频率、功能预测等。同时,用户也可以上传和整合自定义的注释文件,以满足特定研究需求。
- 项目管理与团队协作:
seqr支持创建和管理多个项目,允许多个用户在同一项目下进行分析,共享过滤策略、注释和分析结果。这种协作模式对于大型研究团队或多中心合作项目尤为重要。 - 灵活的数据导入与导出: 支持标准VCF文件作为变异输入,并可导入BAM文件进行可视化。分析结果可以导出为多种格式,便于进一步的统计分析或报告生成。
在医学科研实践中,seqr 的这些功能可以应用于多种场景。例如,临床遗传医生可以利用它对疑难罕见病患者的基因组数据进行快速筛选,结合患者的临床表型,识别潜在的致病变异,从而辅助临床诊断。科研团队则可以利用其强大的过滤和注释功能,从大规模罕见病队列中筛选出与特定疾病相关的候选基因,为后续的功能验证实验提供重要线索。此外,在药物研发的早期阶段,研究人员也可以通过分析疾病相关基因的变异谱,识别潜在的药物靶点,为新药开发提供遗传学依据。
部署与数据管理考量
作为一款开源工具,seqr 的部署和维护需要用户具备一定的技术能力。它通常采用自部署模式,这意味着用户需要自行配置服务器环境、数据库(如PostgreSQL)以及Python和Docker等依赖项。虽然这增加了初始设置的复杂性,但也带来了显著的优势:
“自部署模式赋予了用户对数据完全的控制权。所有基因组数据都存储在用户自己的服务器上,避免了将敏感数据上传至第三方平台的隐私风险,这对于涉及患者基因组信息的医学研究至关重要。”
然而,这种模式也对用户的IT基础设施和生物信息学支持团队提出了要求。例如,处理大规模基因组数据需要充足的存储空间、高性能的计算资源和稳定的网络环境。数据导入过程也可能涉及复杂的预处理和索引步骤,需要熟悉命令行操作和数据标准化流程。对于缺乏此类技术支持的小型实验室或个人研究者而言,seqr 的部署和日常维护可能会构成挑战。
尽管如此,seqr 的开源性质也意味着其具有高度的可定制性。具备开发能力的团队可以根据自身需求,对平台进行二次开发,集成特定的内部工具或数据库,从而更好地适应其研究流程。
适用场景与潜在局限
seqr 在罕见病基因组研究领域展现出其独特价值,但并非适用于所有类型的医学科研任务。它最适合以下场景:
- 专注于罕见病、单基因遗传病的诊断和研究,需要对全外显子组或全基因组测序数据进行深度变异解读的团队。
- 需要进行家族系分析,识别复杂遗传模式的临床遗传实验室和科研机构。
- 对数据隐私和安全性有较高要求,希望将所有数据存储在本地服务器上的用户。
- 具备一定的生物信息学和IT运维能力,能够自行部署、维护和更新开源软件的团队。
然而,对于以下情况,seqr 可能不是最理想的选择:
- 主要进行常见病多基因遗传关联分析(GWAS)或群体遗传学研究的用户,这些场景可能需要更专业的统计遗传学工具。
- 主要处理非基因组数据(如转录组、蛋白质组、代谢组数据)的科研项目。
- 不具备服务器部署和维护能力,或倾向于使用完全托管式商业服务的用户。
- 寻求即插即用、无需任何技术配置的“一键式”解决方案的用户。
总而言之,seqr 是一个功能强大且灵活的罕见病基因组数据分析平台,它为医学科研人员提供了一个高效的工具来探索遗传变异的奥秘。但用户在选择时,应充分评估自身的技术能力和资源投入,以确保能够充分利用其潜力。
同类工具推荐
如果你需要更完整的文献工作流
从检索到精读,一站完成
这个工具适合特定场景。如果你需要中文检索、实时翻译、AI 辅助精读,可以试试超能文献。
了解超能文献