繁体   English   中英

在 Python 中停止程序并保存数据的最佳方法是什么?

[英]What is the best way to stop a program in Python and save the data?

我对在 Python 中运行时停止程序不感兴趣,当然,控制 c 可以做到这一点。 我感兴趣的是以下情况:假设您有一个运行 5 小时的程序。 您让它运行了两个小时,然后决定到目前为止您所做的事情值得保存,但您仍然不想继续。 那么保存数据和退出程序的最佳方法是什么? 到现在为止,我所做的是在泡菜中存储一个布尔值,然后在每个循环中打开泡菜并检查其值。 如果布尔值为真,则程序继续运行,如果为假,则程序停止并保存数据并退出。 我可以使用不同的程序更改布尔值。 然而,即使泡菜只由一个布尔值组成,它仍然会严重减慢程序的速度,可能多达 10 倍,因为泡菜需要很长时间才能打开。 我考虑过其他解决方案,我知道 pdb_trace() 工具,但我真的不知道在这种情况下如何使用它。 我在想也许设置环境变量可能会有所帮助,但我不太擅长设置环境变量。 任何建议,将不胜感激。

答案包括检查环境中的变量和文件等内容。 这些都行,但你能不能:

try:
  main()
except KeyboardInterrupt:
  save()

或者,如果保存过程与您在 main 完成后使用的过程相同,则更强大的策略是

try:
  main()
finally:
  save()

在这里, save()将针对任何错误、 KeyboardInterrupt或其他错误运行。 如果main()成功,它也会运行。

如果你想用一个单独的程序关闭它,你可以发送一个信号。

为了您有趣的任务只是为了好玩,我决定实现非常复杂但通用的异步处理任何命令的解决方案。 命令在cmds.txt文件中提供,每行一个命令。 现在只支持saveexit两个命令。 save可能包含空格后的第二个可选参数,要保存到的文件名(默认为save.txt )。

如果程序异常退出(未提供exit命令),则工作将保存到临时文件save.txt.tmp

cmds.txt文件在单独的线程中处理,每秒检查一次文件,检查速度非常快因此不占用CPU,检查只是测试文件修改时间是否改变。 每个新命令都应添加到新行的文件末尾,不应删除已处理的行。 在程序启动命令文件被清除。

主线程只检查has_cmds bool 变量(如果有新命令)它非常快并且可以经常完成,例如在处理像 10-20 毫秒这样的最小任务之后。 没有互斥体,因此所有工作都非常快。

例如使用主线程在随机时间点产生任务处理的结果并将结果存储到数组中。 在保存命令时,这个结果数组被保存为 JSON。

程序将有关它所做工作的所有信息打印到控制台中,并带有时间戳。

要测试程序,请执行以下操作:

  1. 启动程序。 它立即开始处理计算工作。
  2. 在任何文本编辑器中打开cmds.txt
  3. 添加带有save字符串的新行。 保存存档。
  4. 程序应该打印出save命令已被识别、处理并将工作保存到文件save.txt
  5. 在编辑器中添加另一行save other.txt 保存存档
  6. 程序应该打印它有保存工作到save.txt
  7. 添加新行exit并保存。
  8. 程序应该退出。
  9. 再次尝试运行程序。
  10. 尝试在程序控制台中按Ctrl+C
  11. 程序应该捕获这个键盘中断并说明这一点,工作也被保存到临时文件save.txt.tmp ,程序退出。

当然,在最简单的情况下,为了节省键盘中断的工作,应该像在这个答案中那样完成。

您还可以像在这个解决方案中那样通过处理 SIGINT 来优雅地实现进程终止。 SIGINT 可以使用此程序 windows-kill发送到程序,语法为windows-kill -SIGINT PID ,其中PID可以通过微软的 pslist获得。

import threading, random, os, json, time, traceback

cmds = []
has_cmds = False
cmds_fname = 'cmds.txt'
save_fname = 'save.txt'
save_fname_tmp = 'save.txt.tmp'

def CurTimeStr(*, exact = False):
    from datetime import datetime
    return (datetime.now(), datetime.utcnow())[exact].strftime(('[%H:%M:%S]', '[%Y-%m-%d %H:%M:%S.%f UTC]')[exact])

def Print(*pargs, **nargs):
    print(CurTimeStr(), *pargs, flush = True, **nargs)
    
def AddCmd(c, *, processed = False):
    global cmds, has_cmds
    cmds.append({**{'processed': threading.Event()}, **c})
    if processed:
        cmds[-1]['processed'].set()
    has_cmds = True
    return cmds[-1]

def ExternalCommandsThread():
    global cmds, has_cmds
    Print('Cmds thread started.')
    first, next_line, mtime = True, 0, 0.
    while True:
        try:
            if first:
                Print(f'Cleaning cmds file "{cmds_fname}".')
                with open(cmds_fname, 'wb') as f:
                    pass
                first = False
            if os.path.exists(cmds_fname) and abs(os.path.getmtime(cmds_fname) - mtime) > 0.0001 and os.path.getsize(cmds_fname) > 0:
                Print(f'Updated cmds file "{cmds_fname}". Processing lines starting from {next_line + 1}.')
                with open(cmds_fname, 'r', encoding = 'utf-8-sig') as f:
                    data = f.read()
                lines = list(data.splitlines())
                try:
                    mtime = os.path.getmtime(cmds_fname)
                    for iline, line in zip(range(next_line, len(lines)), lines[next_line:]):
                        line = line.strip()
                        if not line:
                            continue
                        if line[0] not in ['[', '{', '"']:
                            cmd = line.split()
                        else:
                            cmd = json.loads(line)
                        pargs = []
                        if type(cmd) is list:
                            cmd, *pargs = cmd
                        cmd = {'cmd': cmd, 'pargs': pargs}
                        assert 'cmd' in cmd, 'No "cmd" in command line!'
                        c = cmd['cmd']
                        if c in ['save']:
                            assert len(set(cmd.keys()) - {'cmd', 'fname', 'pargs'}) == 0
                            AddCmd({'cmd': 'save', 'fname': cmd.get('fname', (cmd['pargs'] or [save_fname])[0])})
                        elif c == 'exit':
                            AddCmd({'cmd': 'exit'})
                        else:
                            assert False, f'Unrecognized cmd "{c}"!'
                        Print(f'Parsed cmd "{c}" on line {iline + 1}.')
                        next_line = iline + 1
                except (json.decoder.JSONDecodeError, AssertionError) as ex:
                    traceback.print_exc()
                    Print(f'Failed to parse cmds line {iline + 1} with text "{line}"!')
                except:
                    raise
            for i, c in enumerate(cmds):
                if c is None:
                    continue
                if not c['processed'].is_set():
                    has_cmds = True
                while not c['processed'].wait(10):
                    Print(f'Timed out waiting for cmd "{c["cmd"]}" to be processed, continuing waiting!')
                Print(f'Processed cmd "{c["cmd"]}".')
                cmds[i] = None
                if c['cmd'] == 'exit':
                    Print('Exit cmd. Cmds thread finishes.')
                    return
            has_cmds = False
            time.sleep(1)
        except Exception as ex:
            traceback.print_exc()
            Print(f'Exception ^^^^^ in Cmds thread!')
            AddCmd({'cmd': 'exit'})
            time.sleep(3)

def Main():
    global cmds, has_cmds
    
    Print('Main thread started.')
    
    threading.Thread(target = ExternalCommandsThread, daemon = False).start()
    
    results = []
    
    def SaveWork(fname):
        with open(fname, 'w', encoding = 'utf-8') as f:
            f.write(json.dumps(results, ensure_ascii = False, indent = 4))
        Print(f'Work saved to "{fname}".')
        
    def ProcessCmds():
        # Returns False only if program should exit
        for c in cmds:
            if c is None or c['processed'].is_set():
                continue
            if c['cmd'] == 'save':
                SaveWork(c['fname'])
            elif c['cmd'] == 'exit':
                Print('Exit cmd. Main thread finishes...')
                c['processed'].set()
                return False
            else:
                assert False, 'Unknown cmd "c["cmd"]"!'
            c['processed'].set()
        return True

    try:    
        # Main loop of tasks processing
        for i in range(1000):
            for j in range(10):
                if has_cmds and not ProcessCmds(): # Very fast check if there are any commands
                    return # Exit
                # Emulate small work of 0-200 ms long.
                time.sleep(random.random() * 0.2)
                # Store results of work in array
                results.append({'time': CurTimeStr(exact = True), 'i': i, 'j': j})
        assert False, 'Main finished without exit cmd!'
    except BaseException as ex:
        traceback.print_exc()
        Print(f'Exception ^^^^^ in Main thread!')
        SaveWork(save_fname_tmp)
        AddCmd({'cmd': 'exit'}, processed = True)
    
if __name__ == '__main__':
    Main()

示例输出 1:

[08:15:16] Main thread started.
[08:15:16] Cmds thread started.
[08:15:16] Cleaning cmds file "cmds.txt".
[08:15:21] Updated cmds file "cmds.txt". Processing lines starting from 1.
[08:15:21] Parsed cmd "save" on line 1.
[08:15:21] Work saved to "save.txt".
[08:15:21] Processed cmd "save".
[08:15:31] Updated cmds file "cmds.txt". Processing lines starting from 2.
[08:15:31] Parsed cmd "save" on line 2.
[08:15:31] Work saved to "other.txt".
[08:15:31] Processed cmd "save".
[08:15:35] Updated cmds file "cmds.txt". Processing lines starting from 3.
[08:15:35] Parsed cmd "exit" on line 3.
[08:15:35] Exit cmd. Main thread finishes...
[08:15:35] Processed cmd "exit".
[08:15:35] Exit cmd. Cmds thread finishes.

命令文件cmds.txt对应于上面的输出:

save
save other.txt
exit

示例输出 2:

[08:14:39] Main thread started.
[08:14:39] Cmds thread started.
[08:14:39] Cleaning cmds file "cmds.txt".
Traceback (most recent call last):
  File "stackoverflow_64165394_processing_commands_in_prog.py", line 127, in Main
    time.sleep(random.random() * 0.2)
KeyboardInterrupt
[08:14:40] Exception ^^^^^ in Main thread!
[08:14:40] Work saved to "save.txt.tmp".
[08:14:41] Processed cmd "exit".
[08:14:41] Exit cmd. Cmds thread finishes.

一块示例save.txt

[
    {
        "time": "[2020-10-02 05:15:16.836030 UTC]",
        "i": 0,
        "j": 0
    },
    {
        "time": "[2020-10-02 05:15:16.917989 UTC]",
        "i": 0,
        "j": 1
    },
    {
        "time": "[2020-10-02 05:15:17.011129 UTC]",
        "i": 0,
        "j": 2
    },
    {
        "time": "[2020-10-02 05:15:17.156579 UTC]",
        "i": 0,
        "j": 3
    },

    ................

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM