我正在尝试使用pyranges进行一些有效的实现,但与 R GenomicRanges相比,它非常有限且不灵活。 假设我有两个Pyranges表: pr1 & pr2 。 我想获取 pr2 中 pr1 的重叠行的索引,如果没有发生重叠,我想获取 null。 那可能吗? 例如,假设我们有两个 ...
我正在尝试使用pyranges进行一些有效的实现,但与 R GenomicRanges相比,它非常有限且不灵活。 假设我有两个Pyranges表: pr1 & pr2 。 我想获取 pr2 中 pr1 的重叠行的索引,如果没有发生重叠,我想获取 null。 那可能吗? 例如,假设我们有两个 ...
我有多个.bed 文件,我想对它们执行连接、交集等操作。 我正在使用pyranges库来读取 .bed 文件并执行这些操作。 As.bed 文件允许使用或不使用“chr”前缀命名染色体,我想在执行操作之前将不同.bed 文件中的所有染色体名称格式化为相同的格式。 因此,操作会产生预期的输出。 我试 ...
我有一个包含变体信息的.vcf 文件和一个包含区域研究信息的.bed 文件。 我正在使用pyranges库来读取 .bed 文件。 我想过滤掉位于.bed 文件中指定的研究区间区域内的所有变体 in.vcf 文件。 由于 pyranges 提供了 pandas dataframe,我可以遍历每一行 ...
Pyranges class 来自类似名称的 package 有两种功能略有不同的方法: intersect和overlay 。 Intersect 方法描述与重叠的方法非常相似: Return overlapping subintervals. vs Return overlapping i ...
我试图找到至少由用户设置的一些最小重叠长度重叠的间隔对。 间隔来自这个熊猫数据框: import pandas as pds print(df1.head()) print(df1.tail()) 其中start_pos是间隔开始的地方, end_pos是间隔结束的地方。 read_len ...
在 R 中(虽然冗长): 这是一个测试 data.frame 首先我制作 GRanges 对象: 然后我减少了折叠成新农庄对象的间隔: 现在将一个新列附加到原始数据帧,以确认哪些行属于同一个连续的“块”。 输出: 我如何在 Python 中做到这一点? 我知道 pybedtoo ...