首页 > 技术与支持 > 样本标记/追踪与质控在大规模新一代测序 项目中的必要性与技术方案
样本标记/追踪与质控在大规模新一代测序 项目中的必要性与技术方案
点击次数:2936 发布时间:2017/7/25 13:54:03

必要

随着精准医学项目在范围内的不断开展,基于新一代测序(NGS)技术的大规模基因组数据采集已经成为重要的研究手段之一。在此基础上建立起来的大数据平台,以精准、全面的健康和医学数据,将疾病诊断与治疗,药物研发与个体用药,人群的健康保障等临床与转化医学研究带来极大的推动。

大规模人群开展NGS测序工作样本准确可溯源性将会对的大数据质量产生不可忽视的影响由于NGS测序流程的复杂性(参见下图,NGS测序工作经典流程),在样本库内得到准确标记样本,在测序流程中仍然有一定几率会发生混淆或者污染。根据国际上大型测序中心的估算,随着测序样本量的增加一个操作流程完善、工作人员受过专业培训的基因检测实验室仍然可能产生千分之一左右的样本偏差

因此,一种准确有效却又成本低廉的样本标记与追踪手段规模NGS测序工作中具有重要的现实意义。在美国ACMG(美国医学遗传学与基因组学学院发布“临床实验室NGS测序标准”中指明:相关实验室必须采取措施,避免样本混淆,并能够随时追踪确认终结果20173月,中华医学会病理学分会发布的“临床分子病理实验室二代基因测序检测专家共识”进一步阐明:“为确保检测过程中样本没有混淆或污染,可选用多个SNV位点或其他标签作为样本身份标识(sample ID),在检测前对每个样本进行SNV位点信息的测定,在NGS检测后对上述位点进行追踪,证明没有交叉污染”

同时一个大型测序数据库中面临的样本种类较为繁其中与肿瘤相关的样本类型如石蜡包埋切片FFPE)中提取的DNA血浆中提取的循环肿瘤DNA,均正确标记、追踪之外,还需NGS文库制备之前,对其DNA片段降解程度进行有效评估,从而防止质量较差的样本带来的测序成本损失。

技术方案:

样本标记与跟踪目前主要方案,是从待测序列全基因、全外显子组、靶向片段等)中选择若干标志性单碱基核苷酸变异SNV),样本入库及测序前,进行基于这些位点等位基因分型,从而确保样本的收集与使用流程中没有发生混淆。测序完成后,再次利用之前这些位点的基因数据与测序结果进行再次验证比对,如果信息一致,即可确认样本正确性,以及测序覆盖范围与数据质量均达到标准

达到足够区分效果,SNV需要满足以下点标准:1检测人群(中国人群)中具有较高的合度与区分力2)需达到一定数量30-40)以在大规模样本中仍区分所有个体样本。根据这两点标准,国人类基因组测序中心Broad Institute与华大基因均采用美国Agena Bioscience公司基于核酸质谱MassARRAY®开发的样本标记/追踪技术。

该技术是利用MassARRAY®可以在一个反应完成40SNV分型的特点,根据不同测序项目目标片段选择40SNV位点(包括性染色体标记位点,用于追踪样本性别信息)加入用于样本降解程度评估片段完整性内参标记,在同一次反应中,同时完成对样本的标记控,随后报告软件自动生成检测结果,并整合进入样本库相关数据。

根据样本库与数据库规模,MassARRAY®平台可采384格式。在一天内,该平台可完成对6384孔芯片(2304样本的标记/追踪与质控

利用MassARRAY®强大的定制功能,对不同的测序项目可以选取不同的SNV位点,整合为新检测组合,因此具有更高的灵活性与针对