繁体   English   中英

线性回归 Model 随着用户选择和训练数据而改进

[英]Linear Regression Model that improves as the user selects and trains data

我正在开发一个脚本来检测来自生物源的信号数据的峰值。 我想创建一个半自动化的 model 来帮助预测哪些峰值是正确的。 该脚本得到改进,因为用户手动选择了其中一些峰值来帮助教导 model 哪些是正确的。

我试图达到的工作流程是这样的: 1. 用户手动选择数据 2. 脚本获取正确的数据并将其放入 model 3. 使用 model 预测给定峰值的可能性是正确的。 4. 希望有足够的数据和训练,它可以自动运行通过 rest。

我也不知道一般主题的名称,我正在努力寻找谷歌的内容。

我尝试将其拟合到 scikit learn 中的线性回归 model 中,但我没有足够的数据集(因为它从用户的第一次干预中学习)。 我正在做的事情可能吗?

很抱歉这个答案的笼统性,但 OP 要求提供一般性主题。

这听起来像是半监督学习这里是 scikit-learn这里更多细节可能有用。

没有标记数据可以开始。 开始手动过程以获取一些标记数据。 很快,半监督就可以开始并接管——通过一个过程来衡量其准确性。 适合您的情况,是一个很好的起点。

最终,您可能拥有“足够”正确标记的数据,您可以研究拟合经典算法来预测余数。 “足够”与问题的难度有关。 可能是几十,几百,几千,...

根据您情况的其他细节,强化学习可能会起作用。 正如您所描述的情况,这可能行不通,但您的环境中可能还有其他细节可以利用这个系列。

警告词——尤其是机器学习和半监督学习可能并不总是对每个问题都有效。 测量,测量,测量。

谢谢大家的帮助。 我正在和一位同事交谈,他将我推荐给在线机器学习 我想这就是我要找的那个。 虽然我不会处理时间序列数据或来自在线的流式数据,但我认为该方法足以满足我的需求。 这种方法允许一个一个地训练数据,而不是批量训练。 我认为 SciKit Learn 目前不具备开箱即用的在线机器学习能力。

我认为很好地概括了在线机器学习的优势(还展示了 creme python 库)。

再次感谢!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM