繁体   English   中英

Snakemake:本地机器上的 SFTP

[英]Snakemake : SFTP on local machine

我从本地机器与远程服务器上的 ssh 连接。
我在远程服务器上运行我的 Snakemake。
我想将本地计算机上的文件用作规则的输入。
当然,因为我在服务器上运行我的 Snakemake,服务器成为本地机器,本地机器成为远程机器(对于 Snakemake)。

from snakemake.remote.SFTP import RemoteProvider

# I am not sure about the private key, is it the one I have on the server ?
# I have the same result with or without private_key anyway

# SFTP = RemoteProvider(port=22, username="myusername", private_key="/path/to/.ssh/id_rsa")
SFTP = RemoteProvider(port=22, username="myusername")

configfile : "config.json"

localrules: copyBclLocalToCluster

rule all:
    input:
        "copycluster.txt"

rule copyBclLocalToCluster:
    input:
        SFTP.remote("adress:path/to/filelocal.txt")
    output:
        "copycluster.txt"
    shell:
        "scp {input} {output}"

-----------------------------------------
Building DAG of jobs...
MissingInputException in line 26 of /path/to/Snakefile:
Missing input files for rule copyBclLocalToCluster:
adress:path/to/filelocal.txt

https://snakemake.readthedocs.io/en/stable/snakefiles/remote_files.html
使用的远程文件地址必须与主机(域或 IP 地址)和远程服务器上文件的绝对路径一起指定。 如果服务器上的 SSH 守护进程在 RemoteProvider 或每个 remote() 实例中侦听 22 以外的端口,则可以指定端口:

文档说端口不应该是端口 22,但为什么呢? 我真的很想使用它,因为我不知道如何配置另一个端口,而且我什至不确定是否有权这样做。

真的是端口问题吗? 或者我只是不明白如何将 SFTP 与 Snakemake 一起使用。

在我的本地机器上使用文件作为我的 snakemake 输入的最佳方法是什么?


编辑

这不是端口的问题,我什至不需要指定它,因为它是端口 22。
我试图指定好的 ssh 私钥:

SFTP = RemoteProvider(port=22, username="myusername", private_key="/path/to/.ssh/id_rsa")
-----------------------------
Building DAG of jobs...
MissingInputException in line 26 of /path/to/Snakefile:
Missing input files for rule copyBclLocalToCluster:
adress:path/to/filelocal.txt

如果我尝试sftp myusername@adress:path/to/filelocal.txt . 在我服务器上的控制台上它工作正常。

为什么它在 snakemake 中不起作用?


编辑

当我尝试在remoteProvider使用我的密码而不是 ssh-key 时,我remoteProvider了同样的错误。

SFTP = RemoteProvider(port=22, username="myusername", password="mypassword")
--------------------------------
Building DAG of jobs...
MissingInputException in line 26 of /path/to/Snakefile:
Missing input files for rule copyBclLocalToCluster:
adress:path/to/filelocal.txt

我确定地址、用户名、密码、ssh-key 是正确的并且文件存在,我可以在snakemake 之外进行它工作正常。


编辑

由于RemoteProvider用途pysftp ,我试图相同的文件复制与pysftppython脚本。

import pysftp
with pysftp.Connection(adress, 
                       username="myusername",
                       private_key_pass="/path/to/.ssh/id_rsa") as sftp:
    sftp.get(path/to/filelocal.txt, /path/on/cluster/fileCOPY.txt)

它工作正常,所以问题肯定来自我的 Snakefile。


编辑

RemoteProvider也需要ftputil ,我在 python 脚本中尝试了 ftputil 。

import ftputil
with ftputil.FTPHost("adress", "myusername", "mypassword") as ftp_host:
    print(getcwd())
    ftp_host.download(remote_path, local_path)
----------------------------------------------
Traceback (most recent call last):
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/site-packages/ftputil/host.py", line 129, in _make_session
    return factory(*args, **kwargs)
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/ftplib.py", line 117, in __init__
    self.connect(host)
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/ftplib.py", line 152, in connect
    source_address=self.source_address)
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/socket.py", line 724, in create_connection
    raise err
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/socket.py", line 713, in create_connection
    sock.connect(sa)
ConnectionRefusedError: [Errno 111] Connection refused

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "sftptest.py", line 16, in <module>
    with ftputil.FTPHost("adress", "myusername", "mypassword") as ftp_host:
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/site-packages/ftputil/host.py", line 69, in __init__
    self._session = self._make_session()
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/site-packages/ftputil/host.py", line 129, in _make_session
    return factory(*args, **kwargs)
  File "/work/username/miniconda3/envs/RNAseq_snakemake/lib/python3.6/site-packages/ftputil/error.py", line 146, in __exit__
    raise FTPOSError(*exc_value.args, original_exception=exc_value)
ftputil.error.FTPOSError: [Errno 111] Connection refused
Debugging info: ftputil 3.2, Python 3.6.7 (linux)

会不会有问题? 但是我在snakemake中没有这种错误,只是缺少文件错误。 我不明白为什么 ftputil 不起作用。

所以我在 Snakemake 的源代码中做了一个快速而肮脏的搜索,Snakemake 使用了需要用户名和密码的ftputil 当您不提供 Snakemake 的 ssh-key 路径时,此密码将默认为None ,然后传递给ftputil

参见Snakemake 源

我同意默认行为应该默认为更合理的东西,比如~/.ssh/id_rsa ,但不幸的是它没有。

当您在控制台上使用 SFTP 时,您必须编写

sftp myusername@adress:/path/to/file .

但是在Snakemake的远程功能中,您应该删除主机和文件路径之间的“:”。
我被 SFTP 语法误导了,但它在 snakemake 文档中写得很好

# example from snakemake doc
SFTP.remote("example.com/path/to/file.bam")

# what I was doing badly
SFTP.remote("adress:path/to/filelocal.txt")

正确的命令是:

from snakemake.remote.SFTP import RemoteProvider
SFTP = RemoteProvider(port=22, username="myusername", password="mypassword")
rule all:
    input:
        # "/" instead of ":" between host and the path of the file
        SFTP.remote("adress/path/to/filelocal.txt") 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM