簡體   English   中英

使用 pyranges 庫,如何檢查染色體 position 是否包含在任何區間中?

[英]Using pyranges library, How to check if a chromosome position is contained in any interval?

我有一個包含變體信息的.vcf 文件和一個包含區域研究信息的.bed 文件。 我正在使用pyranges庫來讀取 .bed 文件。 我想過濾掉位於.bed 文件中指定的研究區間區域內的所有變體 in.vcf 文件。 由於 pyranges 提供了 pandas dataframe,我可以遍歷每一行並檢查我的變體 position 的包含情況; 但是,我正在尋找可以幫助我實現這一目標的 API。

例子:

>> df = pd.DataFrame({"Chromosome": ["chr1", "chr2"], "Start": [100, 200],
...                    "End": [150, 201]})
>> pr.PyRanges(df)

+--------------+-----------+-----------+
| Chromosome   |     Start |       End |
| (category)   |   (int32) |   (int32) |
|--------------+-----------+-----------|
| chr1         |       100 |       150 |
| chr2         |       200 |       201 |
+--------------+-----------+-----------+

是否有 API 來查找染色體“chr1”的染色體 position 125 是否位於任何區間內。 在上述情況下,它將為 True,因為 125 位於區間 100 - 150 中。

gr = pr.PyRanges(df)
gr['chr1', 125:126]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM