热点新闻
宏基因组测序分析(十四) 分箱结果评估
2023-09-29 12:26  浏览:1240  搜索引擎搜索“手机易展网”
温馨提示:信息一旦丢失不一定找得到,请务必收藏信息以备急用!本站所有信息均是注册会员发布如遇到侵权请联系文章中的联系方式或客服删除!
联系我时,请说明是在手机易展网看到的信息,谢谢。
展会发布 展会网站大全 报名观展合作 软文发布

分箱结果可以使用 checkM 检查完整性和污染度。

checkM

基于数据库中构建好的单拷贝基因集和进化树,将bin定位到进化树中找到参考物种,基于谱系特异的marker gene(单拷贝),进行完整性和污染度进行评估。







  • 数据准备:上一步的分箱结果

参考脚本

# 运行checkM checkm lineage_wf \ --threads 5 \ # 线程 --tmpdir ./ \ # tmp目录路径 --extension fa \ # 序列文件后缀 bins \ # 输入,分箱结果目录 checkm \ # 输出目录 > checkM.sh.log 2>&1 # 存储日志




分箱结果去冗余

计算资源充足的情况下,可以将所有测序数据一起进行组装,然后分箱。但实际操作中,由于内存限制,一般会分样品或者将生物学重复放在一起进行拼接。这样就会存在多个组装和分箱结果,需要对其中重复的 bin去冗余。这个操作可以使用 dRep 实现。

# 将所有分箱fasta文件存放在bin目录下 # 运行dRep去冗余 dereplicate out_dRep \ # 最小基因组长度,默认50k --length 50000 \ -comp 75 -con 25 \ #最小的基因组完整度,默认75,最大的基因组污染率,默认25 -g ./bins/*.fasta

欢迎关注Bioinfor 生信云

发布人:7cbf****    IP:117.173.23.***     举报/删稿
展会推荐
让朕来说2句
评论
收藏
点赞
转发