![](/img/trans.png)
[英]using python openpyxl to write to an excel spreadsheet (string searches)
[英]How to write to an Excel spreadsheet using Python?
我需要将程序中的一些数据写入 Excel 电子表格。 我在网上搜索过,似乎有很多可用的软件包(xlwt、XlsXcessive、openpyxl)。 其他人建议写入 .csv 文件(从未使用过 CSV,也不真正了解它是什么)。
该程序非常简单。 我有两个列表(浮点数)和三个变量(字符串)。 我不知道这两个列表的长度,它们可能不会是相同的长度。
我希望布局如下图所示:
粉色列将包含第一个列表的值,绿色列将包含第二个列表的值。
那么最好的方法是什么?
我运行的是 Windows 7,但我不一定会在运行此程序的计算机上安装 Office。
import xlwt
x=1
y=2
z=3
list1=[2.34,4.346,4.234]
book = xlwt.Workbook(encoding="utf-8")
sheet1 = book.add_sheet("Sheet 1")
sheet1.write(0, 0, "Display")
sheet1.write(1, 0, "Dominance")
sheet1.write(2, 0, "Test")
sheet1.write(0, 1, x)
sheet1.write(1, 1, y)
sheet1.write(2, 1, z)
sheet1.write(4, 0, "Stimulus Time")
sheet1.write(4, 1, "Reaction Time")
i=4
for n in list1:
i = i+1
sheet1.write(i, 0, n)
book.save("trial.xls")
我用你所有的建议写了这篇文章。 它完成了工作,但可以稍微改进。
如何将 for 循环中创建的单元格( list1
值)格式化为科学或数字?
我不想截断这些值。 程序中使用的实际值在小数点后大约有 10 位。
使用来自pandas的DataFrame.to_excel 。 Pandas 允许您以功能丰富的数据结构表示您的数据,并且还可以让您读取excel 文件。
您首先必须将数据转换为 DataFrame,然后将其保存到 excel 文件中,如下所示:
In [1]: from pandas import DataFrame
In [2]: l1 = [1,2,3,4]
In [3]: l2 = [1,2,3,4]
In [3]: df = DataFrame({'Stimulus Time': l1, 'Reaction Time': l2})
In [4]: df
Out[4]:
Reaction Time Stimulus Time
0 1 1
1 2 2
2 3 3
3 4 4
In [5]: df.to_excel('test.xlsx', sheet_name='sheet1', index=False)
出来的excel文件是这样的:
请注意,两个列表的长度必须相等,否则熊猫会抱怨。 要解决此问题,请将所有缺失值替换为None
。
import xlwt
def output(filename, sheet, list1, list2, x, y, z):
book = xlwt.Workbook()
sh = book.add_sheet(sheet)
variables = [x, y, z]
x_desc = 'Display'
y_desc = 'Dominance'
z_desc = 'Test'
desc = [x_desc, y_desc, z_desc]
col1_name = 'Stimulus Time'
col2_name = 'Reaction Time'
#You may need to group the variables together
#for n, (v_desc, v) in enumerate(zip(desc, variables)):
for n, v_desc, v in enumerate(zip(desc, variables)):
sh.write(n, 0, v_desc)
sh.write(n, 1, v)
n+=1
sh.write(n, 0, col1_name)
sh.write(n, 1, col2_name)
for m, e1 in enumerate(list1, n+1):
sh.write(m, 0, e1)
for m, e2 in enumerate(list2, n+1):
sh.write(m, 1, e2)
book.save(filename)
更多解释: https ://github.com/python-excel
xlrd/xlwt (标准):Python 的标准库中没有此功能,但我认为xlrd/xlwt是读写 excel 文件的“标准”方式。 制作工作簿、添加工作表、编写数据/公式和格式化单元格相当容易。 如果你需要所有这些东西,你可能会在这个库中获得最大的成功。 我认为您可以选择 openpyxl ,它会非常相似,但我没有使用它。
要使用 xlwt 格式化单元格,请定义XFStyle
并在写入工作表时包含该样式。 这是一个具有多种数字格式的示例。 请参阅下面的示例代码。
Tablib (强大、直观): Tablib是一个更强大且更直观的库,用于处理表格数据。 它可以编写多张工作表以及其他格式的excel工作簿,例如csv、json和yaml。 如果您不需要格式化单元格(如背景颜色),您将帮自己一个忙使用这个库,从长远来看,这将使您走得更远。
csv (简单):您计算机上的文件是文本文件或二进制文件。 文本文件只是字符,包括换行符和制表符等特殊字符,可以在任何地方轻松打开(例如记事本、Web 浏览器或 Office 产品)。 csv 文件是以某种方式格式化的文本文件:每一行是一个值列表,以逗号分隔。 Python 程序可以轻松读写文本,因此 csv 文件是将数据从 Python 程序导出到 excel(或其他 Python 程序)的最简单、最快捷的方法。
Excel 文件是二进制文件,需要知道文件格式的特殊库,这就是为什么您需要额外的 Python 库或 Microsoft Excel、Gnumeric 或 LibreOffice 等特殊程序来读取/写入它们的原因。
import xlwt
style = xlwt.XFStyle()
style.num_format_str = '0.00E+00'
...
for i,n in enumerate(list1):
sheet1.write(i, 0, n, fmt)
我调查了一些 Python 的 Excel 模块,发现openpyxl是最好的。
免费书籍 Automate the Boring Stuff with Python有一章关于 openpyxl的详细信息,或者您可以查看Read the Docs站点。 您无需安装 Office 或 Excel 即可使用 openpyxl。
你的程序看起来像这样:
import openpyxl
wb = openpyxl.load_workbook('example.xlsx')
sheet = wb.get_sheet_by_name('Sheet1')
stimulusTimes = [1, 2, 3]
reactionTimes = [2.3, 5.1, 7.0]
for i in range(len(stimulusTimes)):
sheet['A' + str(i + 6)].value = stimulusTimes[i]
sheet['B' + str(i + 6)].value = reactionTimes[i]
wb.save('example.xlsx')
import xlsxwriter
# Create an new Excel file and add a worksheet.
workbook = xlsxwriter.Workbook('demo.xlsx')
worksheet = workbook.add_worksheet()
# Widen the first column to make the text clearer.
worksheet.set_column('A:A', 20)
# Add a bold format to use to highlight cells.
bold = workbook.add_format({'bold': True})
# Write some simple text.
worksheet.write('A1', 'Hello')
# Text with formatting.
worksheet.write('A2', 'World', bold)
# Write some numbers, with row/column notation.
worksheet.write(2, 0, 123)
worksheet.write(3, 0, 123.456)
# Insert an image.
worksheet.insert_image('B5', 'logo.png')
workbook.close()
CSV 代表逗号分隔值。 CSV 类似于文本文件,只需添加.CSV 扩展名即可创建
例如写这个代码:
f = open('example.csv','w')
f.write("display,variable x")
f.close()
你可以用excel打开这个文件。
尝试查看以下库:
xlwings - 用于从 Python 将数据输入和输出电子表格,以及操作工作簿和图表
ExcelPython - 一个 Excel 插件,用于在 Python 而不是 VBA 中编写用户定义的函数 (UDF) 和宏
xlsxwriter
库非常适合创建.xlsx
文件。 以下代码段从 dicts 列表生成一个.xlsx
文件,同时说明顺序和显示的名称:
from xlsxwriter import Workbook
def create_xlsx_file(file_path: str, headers: dict, items: list):
with Workbook(file_path) as workbook:
worksheet = workbook.add_worksheet()
worksheet.write_row(row=0, col=0, data=headers.values())
header_keys = list(headers.keys())
for index, item in enumerate(items):
row = map(lambda field_id: item.get(field_id, ''), header_keys)
worksheet.write_row(row=index + 1, col=0, data=row)
headers = {
'id': 'User Id',
'name': 'Full Name',
'rating': 'Rating',
}
items = [
{'id': 1, 'name': "Ilir Meta", 'rating': 0.06},
{'id': 2, 'name': "Abdelmadjid Tebboune", 'rating': 4.0},
{'id': 3, 'name': "Alexander Lukashenko", 'rating': 3.1},
{'id': 4, 'name': "Miguel Díaz-Canel", 'rating': 0.32}
]
create_xlsx_file("my-xlsx-file.xlsx", headers, items)
💡注1 - 我故意不回答OP提出的确切情况。 相反,我提出了一个更通用的解决方案恕我直言,大多数访问者都在寻求。 这个问题的标题在搜索引擎中有很好的索引并跟踪大量流量
💡 注意 2 - 如果您没有使用 Python3.6 或更高版本,请考虑在
headers
中使用OrderedDict
。 在 Python3.6 之前,不保留dict
中的顺序。
OpenPyxl
是一个相当不错的库,用于读取/写入 Excel 2010 xlsx/xlsm 文件:
https://openpyxl.readthedocs.io/en/stable
引用它的另一个答案是使用 deperciated 函数( get_sheet_by_name
)。 这是没有它的方法:
import openpyxl
wbkName = 'New.xlsx' #The file should be created before running the code.
wbk = openpyxl.load_workbook(wbkName)
wks = wbk['test1']
someValue = 1337
wks.cell(row=10, column=1).value = someValue
wbk.save(wbkName)
wbk.close
导入确切数字的最简单方法是在l1
和l2
中的数字后添加一个小数。 Python 将此小数点解释为您的指令以包含确切的数字。 如果您需要将其限制在小数位,您应该能够创建一个限制输出的打印命令,简单的如下:
print variable_example[:13]
假设您的数据在小数点后有两个整数,会将其限制为小数点后十位。
您可以尝试基于XlsxWriter的hfexcel Human Friendly 面向对象的 Python 库:
from hfexcel import HFExcel
hf_workbook = HFExcel.hf_workbook('example.xlsx', set_default_styles=False)
hf_workbook.add_style(
"headline",
{
"bold": 1,
"font_size": 14,
"font": "Arial",
"align": "center"
}
)
sheet1 = hf_workbook.add_sheet("sheet1", name="Example Sheet 1")
column1, _ = sheet1.add_column('headline', name='Column 1', width=2)
column1.add_row(data='Column 1 Row 1')
column1.add_row(data='Column 1 Row 2')
column2, _ = sheet1.add_column(name='Column 2')
column2.add_row(data='Column 2 Row 1')
column2.add_row(data='Column 2 Row 2')
column3, _ = sheet1.add_column(name='Column 3')
column3.add_row(data='Column 3 Row 1')
column3.add_row(data='Column 3 Row 2')
# In order to get a row with coordinates:
# sheet[column_index][row_index] => row
print(sheet1[1][1].data)
assert(sheet1[1][1].data == 'Column 2 Row 2')
hf_workbook.save()
如果您需要修改现有工作簿,最安全的方法是使用pyoo 。 您需要安装一些库,并且需要一些麻烦才能跳过,但是一旦设置好,这将是防弹的,因为您正在利用 LibreOffice / OpenOffice 的广泛而可靠的 API。
请参阅我的Gist ,了解如何设置 linux 系统并使用 pyoo 进行一些基本编码。
以下是代码示例:
#!/usr/local/bin/python3
import pyoo
# Connect to LibreOffice using a named pipe
# (named in the soffice process startup)
desktop = pyoo.Desktop(pipe='oo_pyuno')
wkbk = desktop.open_spreadsheet("<xls_file_name>")
sheet = wkbk.sheets['Sheet1']
# Write value 'foo' to cell E5 on Sheet1
sheet[4,4].value='foo'
wkbk.save()
wkbk.close()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.