[英]Pytest: Parameterize unit test using a fixture that uses another fixture as input
我是参数化和固定装置的新手,并且还在学习。 我发现了一些使用间接参数化的帖子,但根据我的代码中的内容,我很难实现。 我将不胜感激关于如何实现这一目标的任何想法。
我的 conftest.py 中有几个固定装置,它们将输入文件提供给测试文件中的 function“get_fus_output()”。 function 处理输入并生成两个数据帧以在我的测试中进行比较。 此外,我将根据共同值 ('Fus_id') 转租这两个 DF 以单独测试它们。 所以这个 function 的 output 将是 [(Truth_df1, test_df1),(Truth_df2, test_df2)...] 只是为了参数化每个测试和真值 df 的测试。 不幸的是,我无法在我的测试 function“test_annotation_match”中使用它,因为这个 function 需要一个夹具。
我无法将夹具作为输入提供给另一个夹具进行参数化。 是的,它在 pytest 中不受支持,但无法找出间接参数化的解决方法。
#fixtures from conftest.py
@pytest.fixture(scope="session")
def test_input_df(fixture_path):
fus_bkpt_file = os.path.join(fixture_path, 'test_bkpt.tsv')
test_input_df= pd.read_csv(fus_bkpt_file, sep='\t')
return test_input_df
@pytest.fixture
def test_truth_df(fixture_path):
test_fus_out_file = os.path.join(fixture_path, 'test_expected_output.tsv')
test_truth_df = pd.read_csv(test_fus_out_file, sep='\t')
return test_truth_df
@pytest.fixture
def res_path():
return utils.get_res_path()
#test script
@pytest.fixture
def get_fus_output(test_input_df, test_truth_df, res_path):
param_list = []
# get output from script
script_out = ex_annot.run(test_input_df, res_path)
for index, row in test_input_df.iterrows():
fus_id = row['Fus_id']
param_list.append((get_frame(test_truth_df, fus_id), get_frame(script_out, fus_id)))
# param_list eg : [(Truth_df1, test_df1),(Truth_df2, test_df2)...]
print(param_list)
return param_list
@pytest.mark.parametrize("get_fus_output", [test_input_df, test_truth_df, res_path], indirect=True)
def test_annotation_match(get_fus_output):
test, expected = get_fusion_output
assert_frame_equal(test, expected, check_dtype=False, check_like=True)
#OUTPUT
================================================================================ ERRORS ================================================================================
_______________________________________________________ ERROR collecting test_annotations.py
_______________________________________________________
test_annotations.py:51: in <module>
@pytest.mark.parametrize("get_fus_output", [test_input_df, test_truth_df, res_path], indirect=True)
E NameError: name 'test_input_df' is not defined
======================================================================= short test summary info ========================================================================
ERROR test_annotations.py - NameError: name 'test_input_df' is not defined
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Interrupted: 1 error during collection !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
=========================================================================== 1 error in 1.46s ===========================================================================
我不是 100% 确定我理解你在这里试图做什么,但我认为你对参数化和 fixture 的作用的理解是不正确的。 似乎您正在尝试使用固定装置来为您的测试创建参数列表,这并不是 go 的正确方法(而且您这样做的方式肯定行不通,正如您所看到的) .
为了全面解释如何解决这个问题,首先,让我介绍一下参数化和固定装置的使用背景。
我不认为这里有任何新内容,只是为了确保我们在同一页面上:
通常,Pytest中,一个test_*
function是一个测试用例:
def test_square():
assert square(3) == 9
如果你想做相同的测试但使用不同的数据,你可以编写单独的测试:
def test_square_pos():
assert square(3) == 9
def test_square_frac():
assert square(0.5) == 0.25
def test_square_zero():
assert square(0) == 0
def test_square_neg():
assert square(-3) == 9
这不是很好,因为它违反了DRY原则。 参数化是解决这个问题的方法。 您可以通过提供测试参数列表将一个测试用例变成多个:
@pytest.mark.parametrize('test_input,expected',
[(3, 9), (0.5, 0.25), (0, 0), (-3, 9)])
def test_square(test_input, expected):
assert square(test_input) == expected
Fixture 也与DRY代码有关,但方式不同。
假设您正在编写一个 web 应用程序。 您可能有多个测试需要连接到数据库。 您可以向每个测试添加相同的代码以打开和设置测试数据库,但这肯定是在重复您自己。 比方说,如果您切换数据库,则需要更新大量测试代码。
夹具是允许您进行一些可用于多个测试的设置(以及可能的拆卸)的功能:
@pytest.fixture
def db_connection():
# Open a temporary database in memory
db = sqlite3.connect(':memory:')
# Create a table of test orders to use
db.execute('CREATE TABLE orders (id, customer, item)')
db.executemany('INSERT INTO orders (id, customer, item) VALUES (?, ?, ?)',
[(1, 'Max', 'Pens'),
(2, 'Rachel', 'Binders'),
(3, 'Max', 'White out'),
(4, 'Alice', 'Highlighters')])
return db
def test_get_orders_by_name(db_connection):
orders = get_orders_by_name(db_connection, 'Max')
assert orders = [(1, 'Max', 'Pens'),
(3, 'Max', 'White out')]
def test_get_orders_by_name_nonexistent(db_connection):
orders = get_orders_by_name(db_connection, 'John')
assert orders = []
好的,在了解了背景知识后,让我们深入研究您的代码。
第一个问题是你的@pytest.mark.parametrize
装饰器:
@pytest.mark.parametrize("get_fus_output", [test_input_df, test_truth_df, res_path], indirect=True)
这不是使用indirect
的正确情况。 就像测试可以参数化一样, 夹具也可以参数化。 从文档中看不是很清楚(在我看来),但indirect
只是参数化固定装置的另一种方法。 这与在另一个 fixture 中使用 fixture完全不同,这正是您想要的。
事实上, get_fus_output
使用test_input_df
、 test_truth_df
和res_path
固定装置,您根本不需要@pytest.mark.parametrize
行。 一般来说,测试 function 或 fixture 的任何参数如果没有以其他方式使用(例如@pytest.mark.parametrize
装饰器) ,将自动假定为 fixture 。
因此,您现有的@pytest.mark.parametrize
没有按照您的预期进行。 那么你如何参数化你的测试呢? 这是一个更大的问题:您正在尝试使用get_fus_output
fixture 为test_annotation_match
创建参数。 这不是你可以用夹具做的事情。
Pytest运行时,首先收集所有的测试用例,然后一个一个运行。 测试参数必须在收集阶段准备就绪,但 fixture 直到测试阶段才会运行。 夹具内的代码无法帮助进行参数化。 您仍然可以通过编程方式生成参数,但固定装置不是这样做的方法。
你需要做几件事:
首先,将get_fus_output
从固定装置转换为常规 function。这意味着删除@pytest.fixture
装饰器,但您还必须更新它以不使用test_input_df
test_truth_df
和res_path
固定装置。 (如果没有其他东西需要它们作为固定装置,您可以将它们全部转换为常规函数,在这种情况下,您可能希望将它们放在conftest.py
之外的它们自己的模块中,或者只是将它们移动到同一个测试脚本中。)
然后, @pytest.mark.parametrize
需要使用 function 来获取参数列表:
@pytest.mark.parametrize("expected,test", get_fus_output())
def test_annotation_match(expected, test):
assert_frame_equal(test, expected, check_dtype=False, check_like=True)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.