[英]Run a Python code over a bunch of files in a folder at a time in linux
我有以下代码
import sys
import glob
for filename in glob.glob(sys.argv[1]):
file = open(filename)
data = [line.rstrip() + "," + filename for line in file]
file.close()
file = open(filename, "w")
file.write("\n".join(data))
file.close()
现在,我想在名为“ CSV”的文件夹中包含的所有文件上执行它。 我正在开发UBUNTU 12.04和Linux的新手。
所有帮助将不胜感激。 谢谢。
我不知道您要达到什么目的,但是如果您要循环浏览文件夹中的许多文件,则可以使用linux find
命令。
您所遇到的一个例子是:
cd /path/to/folder/CSV
find . -name *.csv -exec your_python_script.py {} \;
这将找到所有.csv
文件,并在每个文件上运行python脚本。
确保文件顶部具有#!/bin/env python
并运行sudo chmod +x your_python_script.py
使其可执行。
如果您没有.csv
扩展名,则可以执行以下操作:
cd /path/to/folder/CSV
find . -exec your_python_script.py {} \;
尽管会警告-它将在目录中的每个文件上运行-CSV或其他格式 。
此外,如果我正确理解了您的脚本(只是将文件名附加到最后一列),请尝试以下操作:
#!/bin/env python
import sys
import csv
filename=sys.argv[1]
output_filename='new-'+filename
output_rows = []
with open(filename, 'r') as inputfile:
with open(output_filename) as outputfile:
r = csv.reader(inputfile)
w = csv.writer(outputfile, lineterminator='\n')
for input_row in r:
output_row=input_row.append(filename)
output_rows.append(output_row)
w.writerows(output_rows)
将其另存为CSV
文件夹中的test_python_script.py
。 然后运行:
cd /path/to/folder/CSV
chmod +x test_python_script.py
find . -exec test_python_script.py {} \;
您还可以简单地让外壳为您完成遍历:
python myscript.py path/to/files/*.CSV
然后在您的python脚本中:
[...]
for filename in sys.argv[1:]:
# do stuff...
但是,这在Windows中将不起作用,因为您只会在sys.argv中收到一个参数“ path / to / files / *。CSV”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.