我在插补后获得的 vcf 文件中有超过 20k 个人的基因型。 我会给你一个这个 vcf 文件的方面的例子,只有 7 个样本: 因此,从第 10 列开始,个体的基因型开始。 现在,我需要修改这个 vcf 文件的个别代码,以便拥有一个具有以下方面的 vcf 文件: 因此,我只需要序列号,不需要侧翼的东 ...
我在插补后获得的 vcf 文件中有超过 20k 个人的基因型。 我会给你一个这个 vcf 文件的方面的例子,只有 7 个样本: 因此,从第 10 列开始,个体的基因型开始。 现在,我需要修改这个 vcf 文件的个别代码,以便拥有一个具有以下方面的 vcf 文件: 因此,我只需要序列号,不需要侧翼的东 ...
我在一个标准格式的目录中有一些文件,我希望使用带有部分文件名的 txt 文件通过 * 扩展它们,然后最后添加 a.gz 标签作为 output 比如我的目录下有个叫1.SNV.111-T.vcf的文件,我的txt文件里有111-T。 这将成功运行 bgzip 但实际上将 output 保存为: ' ...
项目清单我尝试使用 bcftools 1.16 添加 F_MISSING 标签。 当我运行此命令时: bcftools +fill-tags input.vcf.gz -- -t 'F_MISSING' | bcftools view -i 'INFO/F_MISSING<0.25' -Oz ...
我正在尝试使用以下通用代码使用 bcftools 生成 bcf 文件 索引是用 排序和标记的 bam 是由 然后我跑了 收到以下错误 索引的一般视图是 我已经尝试从所有行中删除“N”,然后删除所有字母字符,但仍然出现数字错误,例如 我也试过在 txt 文件中传递 bam 文件 但无法继续在 web ...
我正在尝试重新格式化参考图例文件以使其与 bcftools 兼容。 本质上,我需要从这个 go : 对此: 理想情况下使用 bash。 ...
我正在尝试从 ifc.js 查看器中创建一个 bcf 文件。 ifc.js 查看器使用带有相机和场景的 three.js webglrenderer。 这是一个例子。 https://threejs.org/docs/#api/en/cameras/Camera https://three ...
我有一个多样本 vcf 文件,我想在左列中获取一个 ID 表,其中包含其中包含备用等位基因的变体。它应该如下所示: 这是然后读入 R 我尝试过以下组合: bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n'但我不断得到样本 ID ...
我有一个 conda 环境,其中安装了包括 bcftools 在内的软件包。 我正在使用bcftools stats在我的 VCF 文件上生成一些统计信息。 然后,我想使用plot-vcfstats绘制生成的统计数据,也来自 bcftools。 但是,事实证明此命令依赖于我在 conda 环境中安装 ...
我正在使用 Bcftools 从 GVCF 文件中提取单个样本 VCF。 不幸的是,output 的格式似乎不是 Bgzip 压缩的,尽管使用了 -Oz 标志。 有人知道为什么会这样吗? ...
此 bash 脚本旨在成为处理 zipped.vcf 文件的管道的一部分,该文件包含来自多个患者的基因组(这意味着即使压缩文件也很大,例如 3-5GB)。 我的问题是我在运行这个脚本时总是用完 memory 。 它在 GCP 高内存 VM 中运行。 我希望有一种方法可以优化 memory 的使用,这 ...
我正在尝试压缩和索引 VCF 文件并面临几个问题。 当我使用 bgzip/tabix 时,它会抛出一个错误,指出由于某些未排序的值而无法对其进行索引。 当我使用bcftools sort对此 VCF 进行排序以解决 #1 时,由于条目无效,它会引发错误。 我尝试使用 linux 命令进行排序以绕过# ...
我正在创建一个插件,它利用BCFier提供的代码从文件的外部服务器版本中选择元素并在 Revit 视图中突出显示它们,除非在 Revit 中明显找不到元素,因为所有元素都出现并且没有突出显示. 我使用的具体代码片段是: 这是应该过滤列表,它不这样做,因为它产生ID的部分是这个样子的:3GB5Rc ...
我最近在命令行中尝试了bcftools命令(用于处理变体文件)。 我试过的命令如下 但是,该命令正在运行,但需要很长时间才能合并。 所以,我让系统通宵运行。 然而,当我醒来时,我看到系统因电力耗尽而关闭 我如何知道我在 Unix/Linux 终端中的最后一条命令是否成功? 上面显示的命令只 ...
我有来自特定种族的 VCF 文件列表,例如美洲印第安人、中国人、欧洲人等 在每个种族下,我有大约 100 多个文件。 目前,我计算了一个文件的VARIANT QC指标,例如call_rate 、 n_het等,如冰雹教程中所示(参见下图) 图片在这里 但是,现在我想为每个种族创建一个文件,然后计 ...
我想编译最新的 github bcftools,但我在下面收到这些错误。 [安装说明] https://raw.githubusercontent.com/samtools/bcftools/develop/INSTALL提到: 另外,我做了以下事情: BCFTOOLS_PLUGIN ...
为什么我的 VCF 文件的 ALT 列有时包含替代核苷酸以及“符号等位基因”<*>? 这是什么意思? ALT 的图像此外,在 INFO 字段中,AD 标签告诉我零读数具有符号等位基因(即 AD=37,1,0) ...
我的目标是使用 bcftools 检查我的数据集(vcf 文件)中的参考等位基因是否与使用 fixref 插件的参考基因组(fasta 文件)匹配。 在命令行上工作,我首先设置以下环境: 对于不匹配的测试数据集,建议使用以下代码: 当我使用自己的文件运行此代码时(请注意,我的数据是 .vc ...
我想将两个命令行合并为一个,以避免中间文件。 我收到无效的语法错误。 如果您能解释如何在蛇形中组合多个外壳线,我将不胜感激。 ...
我已经按照https://bioconda.github.io/user/install.html#set-up-channels 上的说明安装了 bioconda。 然后我试过了 他们都安装得很好。 然而,当我尝试 或者 按照https://bioconda.github.io/rec ...
我有一个包含 900 个文件的文件夹,名称如下: 我试图用循环索引每个文件: 所以我最终会得到以下结果: 但是,当我运行上述循环时,我只得到第一个染色体条目的索引文件,其余部分被忽略(即仅对一个 chr1_ _ .vcf.gz.tbi 文件进行索引,其余部分被忽略,然后是第一个 chr2 ...