[英]Passing a python dataframe to an object and altering the dataframe
我是python的新手,正在尝试将参数(dataframe)传递给函数并通过读取Excel文件来更改参数(dataframe)的值。 (假设我已经导入了所有必要的文件)
我注意到python在这里没有通过引用传递参数,而我最终没有初始化/更改数据框。
我读到python通过对象引用而不是值或引用传递。 但是,我不需要更改相同的数据框。
输出为:类'pandas.core.frame.DataFrame'>
from pandas import DataFrame as df
class Data:
x = df
@staticmethod
def import_File(df_name , file):
df_name = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1', header=0, skiprows=None, skip_footer=0, index_col=None, parse_cols=None, parse_dates=True, date_parser=True, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, engine=None )
def inputdata():
Data.import_File(Data.x,r"C:\Users\Data\try.xlsx")
print(Data.x)
您似乎很难做很多事情。 我将尝试简化它,同时遵循标准的使用模式。
# Whatever imports you need
import pandas as pd
# Static variables and methods should generally be avoided.
# Change class and variable names to whatever is more suitable.
# Names should be meaningful when possible.
class MyData:
# Load data in constructor. Could easily do this in another method.
def __init__(self, filename):
self.data = pd.io.excel.read_excel(filename, sheetname='Sheet1')
def inputData():
# In my experience, forward slashes work just fine on Windows.
# Create new MyData object using constructor
x = MyData('C:/Users/Data/try.xlsx')
# Access member variable from object
print(x.data)
这是它在方法而不是构造函数中加载的版本。
import pandas as pd
class MyData:
# Constructor
def __init__(self):
# Whatever setup you need
self.data = None
self.loaded = False
# Method with optional argument
def loadFile(self, filename, sheetname='Sheet1')
self.data = pd.io.excel.read_excel(filename, sheetname=sheetname)
self.loaded = True
def inputData():
x = MyData()
x.loadFile('C:/Users/Data/try.xlsx')
print(x.data)
# load some other data, using sheetname 'Sheet2' instead of default
y = MyData()
y.loadFile('C:/Users/Data/tryagain.xlsx', 'Sheet2')
# can also pass arguments by name in any order like this:
# y.loadFile(sheetname='Sheet2', filename='C:/Users/Data/tryagain.xlsx')
print(y.data)
# x and y both still exist with different data.
# calling x.loadFile() again with a different path will overwrite its data.
它不会保存在原始代码中的原因是因为为参数名称分配值永远不会更改Python中的原始变量。 您可以执行以下操作:
# Continuing from the last code block
def loadDefault(data):
data.loadFile('C:/Users/Data/try.xlsx')
def testReference():
x = MyData()
loadDefault(x)
# x.data now has been loaded
print(x.data)
# Another example
def setIndex0(variable, value):
variable[0] = value
def testSetIndex0():
v = ['hello', 'world']
setIndex0(v, 'Good morning')
# v[0] now equals 'Good morning'
print(v[0])
但是您不能这样做:
def setString(variable, value):
# The only thing this changes is the value of variable inside this function.
variable = value
def testSetString():
v = 'Start'
setString(v, 'Finish')
# v is still 'Start'
print(v)
如果您希望能够使用名称指定存储值的位置,则可以使用带有索引/键的数据结构。 词典使您可以使用键访问和存储值。
import pandas as pd
class MyData:
# Constructor
def __init__(self):
# make data a dictionary
self.data = {}
# Method with optional argument
def loadFile(self, storename, filename, sheetname='Sheet1')
self.data[storename] = pd.io.excel.read_excel(filename, sheetname=sheetname)
# Access method
def getData(self, name):
return self.data[name]
def inputData():
x = MyData()
x.loadFile('name1', 'C:/Users/Data/try.xlsx')
x.loadFile('name2', 'C:/Users/Data/tryagain.xlsx', 'Sheet2')
# access Sheet1
print(x.getData('name1'))
# access Sheet2
print(x.getData('name2'))
如果您确实希望函数是静态的,则根本不需要创建新类。 创建类的主要原因是将其用作可重用的结构,以使用特定于该数据的方法来保存数据。
import pandas as pd
# wrap read_excel to make it easier to use
def loadFile(filename, sheetname='Sheet1'):
return pd.io.excel.read_excel(filename, sheetname=sheetname)
def inputData():
x = loadFile('C:/Users/Data/try.xlsx')
print(x)
# the above is exactly the same as
x = pd.io.excel.read_excel('C:/Users/Data/try.xlsx', sheetname='Sheet1')
print(x)
在您的代码中df
是一个类对象。 要创建一个空的数据框,您需要实例化它。 在Python中实例化类使用函数符号。 另外,读取excel文件时不需要传递默认参数。 这将帮助代码看起来更整洁。
另外,读取excel文件时不需要传递默认参数。 这将帮助代码看起来更整洁。
from pandas import DataFrame as df
class Data:
x = df()
@staticmethod
def import_File(df_name, file):
df_name = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')
当您将Data.x
传递给import_File()
, df_name
将指向与Data.x
相同的对象,在这种情况下,该对象是一个空的数据Data.x
。 但是,当你将pd.io.excel.read_excel(file)
到df_name
然后之间的连接df_name
和空数据框被打破, df_name
现指Excel的数据帧。 在此过程中, Data.x
并未发生任何变化,因此它仍连接到空数据框对象。
用字符串看这个的更简单方法:
x = 'red'
df_name = x
我们可以断开字符串对象“ red”之间的df_name
连接,并与对象“ excel”形成一个新的连接。
df_name = 'excel'
print(x)
'red'
但是, Data.x
有一个简单的修复程序可以返回excel数据Data.x
。
from pandas import DataFrame as df
class Data:
x = df()
@staticmethod
def import_File(file):
Data.x = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')
def inputdata():
Data.import_File(r"C:\Users\Data\try.xlsx")
print(Data.x)
但是,我不建议您使用静态方法,您应该在类中包括一个构造函数,如其他答案所建议的那样。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.