
[英]Python: Predicting vector from a scalar
我正在研究一个问题,我必须从标量x预测向量y 。 我目前正在使用线性回归来创建基线 model。但它似乎无法处理多维 output。 我正在使用以下代码: 在这种情况下,x_train 是形状为(1,m)的列向量,y_train 是形状为(m,)的向量的向量。 可以在此处查看生成的错误消息。 我认为 ...
[英]Python: Predicting vector from a scalar
我正在研究一个问题,我必须从标量x预测向量y 。 我目前正在使用线性回归来创建基线 model。但它似乎无法处理多维 output。 我正在使用以下代码: 在这种情况下,x_train 是形状为(1,m)的列向量,y_train 是形状为(m,)的向量的向量。 可以在此处查看生成的错误消息。 我认为 ...
[英]How to make loop with features selection by features importance where deleted features with imp = 0 or below mean imp in each iteration in Python?
我在 Python Pandas 中有 DataFrame,如下所示: 输入数据: Y - 二进制目标 X1...X5 - 预测值 DataFrame源码: 我通过在每次迭代中删除 importance = 0 的特征来进行特征选择,或者如果不是 imporance = 0 的特征,我删除在该迭 ...
[英]How to modify loop builing ML models and generated DataFrame with column presented variable removed in each iteration of for-loop in Python?
我有 Pandas DataFrame 如下所示: 输入数据: Y - 二进制目标 X1...X5 - 预测值 DataFrame源码: 我的代码: -> 我运行 XGBClassifier() model,其中在循环的每个连续迭代中删除一个变量因此,每个连续的 model 构建的变量比前 ...
[英]WER for wav2vec2-base model remains as 1 throughout the whole training process
我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ,此时validation loss明显减少,而WER依然为1。 我尝试打印出预测值和 label 值 ...
[英]Error when trying to run a Python script in Power BI
尝试在 Power BI 中运行 python 脚本时,我不断收到以下错误。 我尝试卸载并重新安装所有 numpy、pandas 但无济于事。 请我提供一些帮助以使其运行 我尝试卸载并重新安装所有 numpy、pandas 但无济于事。 ...
[英]Midjourney Discord image uploading problem
不能仅将 --version 4 与单个图像提示一起使用。 请添加另一个图像提示,或文本提示。 /想象https://media.disc/ 尝试在途中通过链接上传图片 discord 解决问题 ...
[英]Does train and test score change depending on the magnitude of values?
没有具体的代码。 现在,我有一个逻辑回归器,目标列是is_promoted (布尔值),带有 0 和 1。 当我找到训练和测试精度以及 MSE 时,它们在 0 和 1 之间。 我有一个不同的 model,它是一个线性回归器。 目标列是“resale_price”,其值为 10,000 及以上。 当 ...
[英]Pre-Train a Model using imitation learning with Stable-baselines3
我一直在尝试找出一种使用 Stable-baselines3 预训练 model 的方法。 在 Stable-baseline(在 Tensorflow 1.X 上运行的版本)的原始文档中,这似乎是一项简单的任务: 问题是,没有“from stable_baselines 3 .gail impo ...
[英]NLP neural net validation accuracy increases too much (?) between folds in cross validation
我正在使用 BERT 训练 model 以使用两个标签进行分类。 我想使用交叉验证,因为我想对数据集中的每个观察结果进行样本外预测,以便稍后在线性回归中使用。 我有 5 个 EPOCHS。 第一次折叠的行为符合预期:验证准确度在 EPOCHS 中增加,并收敛到我在使用通常的 80-10-10 分割 ...
[英]How to create a few Machine Learning models through all variables and after each iteration next XGBClassifier is created with 1 less var in Python?
我在 Python Pandas 中有 DataFrame,如下所示: 输入数据: Y - 二进制目标 X1...X5 - 预测变量是 X1 X2 X3 X4 X5 1个 111 22 1个 0 150 0 12 33 1个 0 222 1个 150 44 0 ...
[英]Ensemble Learning and Fusion
问题 - 集成学习和分类器融合之间有什么区别(或相同)? 据我了解,ensemble learning是在做最终预测时对模型进行平均,而classifier fusion在意义上也是一样的。 但是,当我搜索有关集成学习的参考资料时,我没有在某些文献中找到“融合”一词的任何提及。 此外,一些参考文献使 ...
[英]How to assign feature weights in XGBClassifier?
我正在尝试为一个特征分配比其他特征更高的权重。 这是我的代码。 我浏览了此处的文档和此处Akshay Sehgal 对类似问题的 stackoverflow 响应。 但是当我使用上面的代码时,出现以下错误? 谁能帮我解决我做错的地方? 谢谢。 ...
[英]How to predict Total Hours needed with List as Input?
我正在努力解决我面临的问题:我有一个不同产品(汽车)的数据集,这些产品在给定时间打开了某些工作订单。 我从历史数据中知道这项工作在TOTAL中造成了多少时间。 现在我想为另一辆汽车(例如汽车 3)预测它。 我应该为此使用哪种类型的算法,回归? 我的想法是将这个基于行的数据集转换为基于二进制值的列 ...
[英]Check which are the features that differentiate between clusters, using a boxplot
我对我的data应用了 UMAP 降维,并将其聚类。 我得到了三个不同的集群: 我有指定 eahc 样本属于哪个集群的数据,以及样本的名称和所有内容。 这是它的一个子样本,我们称之为df_cluster : df_cluster的样本与我用于聚类的原始数据data相同。 这基本上只是您看到的行样 ...
[英]OSError: [E053] Could not read meta.json from model-best.zip
我试图加载训练有素的 spacy model 但出现此错误: 这是我的代码: ...
[英]Transformer Positional Encoding -- What is maxlen used for
这段代码在这里我知道位置编码是用来做什么的,但是 maxlen 是一个常数值吗? 或者它会根据批量大小或数据长度而变化吗? 来自 NLP 的示例: 我在这里不明白的是位置编码中使用的 5000 maxlen 值与它有关。 我用错了吗? maxlen应该按照我给的例子改吗? ...
[英]How to loop and .apply a lambda function on a DataFrame?
我正在构建一个 ML model。我想运行预测位几次,然后计算准确度分数的平均值。 我的代码如下所示: 有没有办法循环预测? 期望的结果是:假设 n=10。 预测运行了 10 次,我得到了每次运行的所有准确度以及最后所有准确度的平均值。 希望这是有道理的。 ...
[英]Implementation of gradient descent is very inefficient and does not work in all cases
我应该为线性回归实现梯度下降。 这是实现: 这适用于小型数据集(25 个元素),但当使用大型数据集(20000 个元素)时,它变得非常慢。 我该如何优化呢? 我试图向量化所有函数,但J()和get_gradient()似乎特别慢。 我还注意到,在使用大型数据集进行调试时,错误会随着算法的运行而增加, ...
[英]logistic-regression converting a categorical column to numeric : single vs multiple column
我想在具有分类HomePl.net列的数据集上训练逻辑回归 model,其中包含 3 个不同的值: Earth 、 Europa 、 Mars 当我做: 它将所有类别分隔为列。然后我使用该数据集训练 model。 我也可以通过做数字类别 如果我使用第二种方法转换分类数据然后训练 model 是否 ...
[英]why smote raise "Found input variables with inconsistent numbers of samples"?
我尝试使用 4401 条推文的数据集对推文中的情绪进行分类,当我使用较小的数据样本(大约 15 条推文)时一切正常,但是当我使用完整的数据集时它会引发错误 当我在使用 countvectorizer 转换数据后尝试使用 smote 对数据进行过采样时发生错误。 这是引发错误的代码 我不明白为什么会 ...