概述 全基因组全新测序(de novosequencing)不需要任何参考序列即可对某个物种进行测序,用生物信息学分析方法对测序序列进行拼接组装,从而获得该物种的基因组序列图谱。通过基因组测序是快速了解物种的重要途径,可加深对所测物种生长、发育、进化、起源等重大问题的认识。自成立以来,CHGCS先后承担和参与了人类基因组测序、水稻4号染色体测序、黑猩猩22号染色体测序、日本血吸虫基因组测序等多个重大项目,研究成果发表于Nature、Science、Nature Genetics、PNAS等众多国际权威学术期刊。 测序策略 估计基因组大小,能否提供单倍体; 需要100ug左右的DNA; 进行ITS和16s检测,确保物种正确及没有细菌污染; 初步测序:先用solexa做30-50倍覆盖率的300bp文库的Paired-end测序,拼装后评估基因组大小及杂合度; 深度测序:solexa测3个Paired-end库(170bp,300bp和500bp),做到100倍覆盖率;至少用454做2倍覆盖率; 框架图:在上述测序拼装的基础上,加测100倍覆盖率的solexa Mate-pair文库(3kb,8kb和20kb); 如果是复杂基因组,需要构建BAC文库,基于BAC末端测序结果进行全长测序。 参与的项目及研究成果 人类基因组计划:3号染色体短臂近着丝粒区,29BAC,3.35Mb序列 水稻(粳稻)4号染色体精细图:112BAC,10Mb序列 黑猩猩22号染色体测序:40BAC,5Mb序列 日本血吸虫基因组测序