![](/img/trans.png)
[英]How to convert chromosome name to same format in pyranges before performing a join
[英]Using pyranges library, How to check if a chromosome position is contained in any interval?
我有一個包含變體信息的.vcf 文件和一個包含區域研究信息的.bed 文件。 我正在使用pyranges庫來讀取 .bed 文件。 我想過濾掉位於.bed 文件中指定的研究區間區域內的所有變體 in.vcf 文件。 由於 pyranges 提供了 pandas dataframe,我可以遍歷每一行並檢查我的變體 position 的包含情況; 但是,我正在尋找可以幫助我實現這一目標的 API。
例子:
>> df = pd.DataFrame({"Chromosome": ["chr1", "chr2"], "Start": [100, 200],
... "End": [150, 201]})
>> pr.PyRanges(df)
+--------------+-----------+-----------+
| Chromosome | Start | End |
| (category) | (int32) | (int32) |
|--------------+-----------+-----------|
| chr1 | 100 | 150 |
| chr2 | 200 | 201 |
+--------------+-----------+-----------+
是否有 API 來查找染色體“chr1”的染色體 position 125 是否位於任何區間內。 在上述情況下,它將為 True,因為 125 位於區間 100 - 150 中。
gr = pr.PyRanges(df)
gr['chr1', 125:126]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.