cost 73 ms
创建一个解决方案,使用 python 将地址自动拆分为单独的组件

[英]Create a solution to automatically split addresses into their separate components using python

我正在尝试找到一种解决方案,以便能够使用 python 将地址自动拆分为单独的组件。下面是一些示例数据完整地址街牌号码街道城市 State Zip 代码 661 Camel Back Road 塔尔萨 俄克拉何马州 74120 661 驼背路塔尔萨俄克拉何马州 68 Gnatty Creek 路 ...

根据文本值对 R 中的数据进行分类 (R studio)

[英]Classifying data in R based on the text value (R studio)

我有一个 dataframe,其中的公司条目如下所示: 公司国家公司1 西班牙公司2 瑞典公司3 美国我想根据该国家/地区是否为欧洲添加一列。 我的最终数据框如下所示: 公司国家欧盟/非欧盟公司1 西班牙欧洲联盟公司2 瑞典欧洲联盟公司3 美国非欧盟多谢!! ...

这些看似完美的ML model有什么问题?

[英]What's wrong with these seemingly perfect ML model?

我想找到一个最优的 model 来解决分配的分类问题。 在我应用 pd.get_dummies() function 预处理数据之前,一切都很顺利。 实验显示了一个不可能完美的结果。 我知道这不太可能发生,但我不知道为什么。 任何帮助将不胜感激。 预处理数据的代码如下 我将数据分为训练和测试,比例 ...

TypeError: where() 收到了 arguments 的无效组合

[英]TypeError: where() received an invalid combination of arguments

我想对 neural.network 预测的值做出判断。 如果大于0.5,则为1,如果小于0.5,则为0。当我运行我的model时,我遇到了这个问题。 我的代码: 我不知道为什么会出现这个问题。希望得到解决方案 ...

为什么 smote 提出“发现样本数量不一致的输入变量”?

[英]why smote raise "Found input variables with inconsistent numbers of samples"?

我尝试使用 4401 条推文的数据集对推文中的情绪进行分类,当我使用较小的数据样本(大约 15 条推文)时一切正常,但是当我使用完整的数据集时它会引发错误 当我在使用 countvectorizer 转换数据后尝试使用 smote 对数据进行过采样时发生错误。 这是引发错误的代码 我不明白为什么会 ...

NN: AttributeError: 'History' object 没有属性 'predict'

[英]NN: AttributeError: 'History' object has no attribute 'predict'

我尝试使用 Keras 进行简单的二进制分类。 为此,我创建了一个简单的神经网络。 但我收到此错误: 我已经在这里尝试了可用的解决方案。 但它不起作用。 我不明白我在这里做错了什么。 请指导我。 ...

KNN中多个K共享相同测试精度时如何选择理想K

[英]How to choose ideal K when multiple K share same testing accuracy in KNN

对于我的 KNN 分类器,我绘制了不同K值(# 最近邻)的训练和测试精度,如下所示: 如您所见,范围 [1, 5] 中的K具有相同的测试精度。 在这种情况下,应该选择什么K值进行推理呢? 我试过什么? 在这种情况下,不能应用肘部技术。 PS:我使用下面的 function 拆分了我的训练和测试 ...

使用 LSTM 预测类别

[英]Using an LSTM to predict a category

我的数据集包含一条数据点曲线,其中有一列标记为“购买”。 “买入”表示曲线在此时达到局部最大值或最小值(由于平滑以找到这些点但主要在 1 行内,因此不完全准确)。 0 表示它不是最大值或最小值,1 表示它是最大值,2 表示它是最小值。 问题是这会在我的数据集中留下大量的 0,我怀疑这些 0 会导 ...

为 BERT 拆分数据集的长文档是否被认为是不好的做法?

[英]Is splitting a long document of a dataset for BERT considered bad practice?

我正在对标记数据集上的 BERT model 进行微调,其中许多文档的长度超过标记器设置的 512 个标记限制。 由于截断会丢失大量我宁愿使用的数据,因此我开始寻找解决方法。 但是我注意到,从未提及在 512 个标记(或其他启发式)之后简单地拆分文档并在数据集中创建具有相同 label 的新条目。 ...

使用 keras 和变压器进行图像分类时应用增量时出现错误“img”

[英]Error 'img' when applying increment with keras and transformers for image classification

我想应用 VIT 进行图像分类。 但我有一个问题,我不知道如何解决它。 我的错误是这个“KeyError:'img'”。 当我应用最后一个命令时显示错误,我不知道我的错误在哪里。 数据集中的图像是 in.png,但我不认为这是错误的。 下面是脚本: ...

为多个(分类)任务训练 wav2vec2

[英]Training wav2vec2 for multiple (classification) tasks

我使用 pytorch 和 huggingface 变压器训练了一个 wav2vec2 model。 这是代码: https://github.com/padmalcom/wav2vec2-nonverbalvocalization 我现在想在第二个任务上训练 model,例如年龄分类或语音识别 ...

如何处理不同特征的数据集?

[英]How to deal with dataset of different features?

我正在努力在 CEA 分类数据集(二进制分类)上创建 MLP model。 每个样本包含 4 个不同的特征,例如电阻和其他值,每个都在其自己的范围内(电阻以百为单位,另一个以微量为单位,等等)。 我还是机器学习的新手,这是第一个真正的 model 构建。 我该如何处理这些数据? 我已尝试使用 fu ...

AttributeError: 'Adam' object 没有属性 'build'

[英]AttributeError: 'Adam' object has no attribute 'build'

创建分类 model 后,我需要使用 k-Cross Fold 验证,但我不断收到此错误:AttributeError: 'Adam' object 没有属性 'build'。 我该如何解决这个问题? 您可以在下面找到完整的错误: 该程序似乎正在尝试使用“copy.deepcopy”创建 Kera ...

SKLearn & ElasticNet:使用准确性作为指标时交叉验证失败

[英]SKLearn & ElasticNet: Cross validation fails when using Accuracy as a metric

我有一个二进制分类问题。 我一直在使用cross validation来优化ElasticNet参数。 然而,ElasticNet 似乎只有在我提供roc_auc作为 CV 期间使用的评分方法时才有效,但是我还想测试各种评分方法,尤其是accuracy 。 具体来说,在使用准确性时,ElasticN ...

为什么 Scikit-Learn 的 DecisionTreeClassifier 在去除零权重特征并重新拟合后返回零权重特征?

[英]Why does Scikit-Learn's DecisionTreeClassifier return zero weighted features after removing zero weighted features and refitting?

我一直在试图弄清楚为什么会这样。 我正在拟合一个DecisionTreeClassifier ,而 model 确定一些特征不能为预测提供信息。 使用所有信息特征(即权重 > 0 的特征)使用相同的超参数拟合相同的 model,现在我得到其他权重为零且之前权重为非零的特征? 我的问题: 这种 ...

用于序列分类的 FIneTunning BERT

[英]FIneTunning BERT for sequence classification

我正在尝试使用 transformers 库微调 BERT model 以进行序列分类。 我不知道我做错了什么,但在训练之后(无论多少个时期)我的 model 只输出相同的 label 对于任何可能的输入。 我不知道我做错了什么。 任何帮助表示赞赏。 泰。 这是我的代码: 进口和启动: 注意:我将 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM