标签[pyranges] - 堆栈内存溢出

如果有重叠，Pyranges 得到索引，如果没有重叠，则得到 NaN - Pyranges gets indices if there are overlaps and NaN if not

我正在尝试使用pyranges进行一些有效的实现，但与 R GenomicRanges相比，它非常有限且不灵活。假设我有两个Pyranges表： pr1 & pr2 。我想获取 pr2 中 pr1 的重叠行的索引，如果没有发生重叠，我想获取 null。那可能吗？例如，假设我们有两个 ...

如何在执行连接之前将染色体名称转换为 pyranges 中的相同格式 - How to convert chromosome name to same format in pyranges before performing a join

我有多个.bed 文件，我想对它们执行连接、交集等操作。我正在使用pyranges库来读取 .bed 文件并执行这些操作。 As.bed 文件允许使用或不使用“chr”前缀命名染色体，我想在执行操作之前将不同.bed 文件中的所有染色体名称格式化为相同的格式。因此，操作会产生预期的输出。我试 ...

使用 pyranges 库，如何检查染色体 position 是否包含在任何区间中？ - Using pyranges library, How to check if a chromosome position is contained in any interval?

我有一个包含变体信息的.vcf 文件和一个包含区域研究信息的.bed 文件。我正在使用pyranges库来读取 .bed 文件。我想过滤掉位于.bed 文件中指定的研究区间区域内的所有变体 in.vcf 文件。由于 pyranges 提供了 pandas dataframe，我可以遍历每一行 ...

Pyranges中重叠和相交方法的区别 - Difference between overlap and intersect methods in Pyranges

Pyranges class 来自类似名称的 package 有两种功能略有不同的方法： intersect和overlay 。 Intersect 方法描述与重叠的方法非常相似： Return overlapping subintervals. vs Return overlapping i ...

查找数百万个范围/间隔之间的重叠 - Finding overlaps between millions of ranges/intervals

我试图找到至少由用户设置的一些最小重叠长度重叠的间隔对。间隔来自这个熊猫数据框： import pandas as pds print(df1.head()) print(df1.tail()) 其中start_pos是间隔开始的地方， end_pos是间隔结束的地方。 read_len ...

pythonic相当于R GRanges中的reduce() - 如何折叠范围数据？ - pythonic equivalent to reduce() in R GRanges - how to collapse ranged data?

在 R 中（虽然冗长）：这是一个测试 data.frame 首先我制作 GRanges 对象：然后我减少了折叠成新农庄对象的间隔：现在将一个新列附加到原始数据帧，以确认哪些行属于同一个连续的“块”。输出：我如何在 Python 中做到这一点？我知道 pybedtoo ...