标签[data-science]

数据科学涉及以任何形式或形式从数据中提取知识或见解。 它可以包含预测分析,通常需要处理大量数据。 请考虑在https://datascience.stackexchange.com/中发布

0
0回复
07

Jupyter未显示完整的词典内容

我的问题如下:当使用Python在Jupyter Notebook中创建字典时,该程序未按照代码显示完整的字典。 字典的len应该为1338(这是我的csv doc中各行的数量),它向我显示了len为
0
0回复
13

在输入NLP模型之前,您是否必须清理测试数据?

这是与自然语言处理有关的问题。 假设我有一个标记的训练和未标记的测试集。 清理火车数据(停用词,词干,标点符号等)后,我将使用清理后的数据来构建模型。 在将其安装到测试数据上时,是否还需要使用与火
-2
0回复
18

如何使用model.predict()预测3块vgg模型?

我正在使用此模型,并且想测试该模型,但是当我尝试使用model.predict函数进行预测时,会抛出输入0层sequence_6的错误。 谁能告诉我如何基于此模型预测图像?
-2
0回复
11

列出组织成几个月的数据框,其中包含nunique和Max()其他功能[关闭]

关闭。 这个问题需要调试细节。 它当前不接受答案。
1
1回复
27

我如何对ID进行分组并互相添加列

我有这样的DF。 我想按ID分组,我必须要达到类似的目的。 14121中有4个id,其总和是76。我该怎么做?
0
0回复
05

在我的Django或Flask应用中将jupyter(经典)或jupyter实验室添加为页面

我正在构建一个小型Web应用程序,用于管理数据科学项目。 我目前正在将Django用于网络应用。 我希望用户能够从我的应用程序内部打开Jupyter笔记本。 我知道这种行为是可能的,因为我可以在PyC
0
1回复
25

如何获得BioBERT嵌入

我在pandas数据框中有一个文本字段,我想为其生成BioBERT嵌入。 有什么简单的方法可以生成向量嵌入? 我想在另一个模型中使用它们。 这是数据帧的假设样本 访问代码
0
1回复
11

物体检测模型所需的最少步数和最少图像数[关闭]

已关闭。 这个问题需要更加集中。 它当前不接受答案。
-1
1回复
34

根据多个值迭代熊猫表[关闭]

关闭。 这个问题需要调试细节。 它当前不接受答案。
-3
0回复
24

用小数重新分配百分比

如何在Golang中使用小数数据类型重新分配百分比? 当前分布 50.0 25.0 25.0 从分布集中删除25.0后,我得到: 33.333333333333336
-1
1回复
31

Logistic回归和单词袋

根据我的理解,X 1是单词的出现,而beta 1是该单词的权重。 我的问题是重量如何计算? 基于什么?
0
0回复
09

Openpyxl库在调用和for循环后给出None为何?

这就是问题退货 档案文件 档案文件 可以帮个忙
-1
0回复
32

查找我们的数据集中哪些列经常一起出现

我有一个数据集,其中有很多列,然后有行显示了列之间的关系。 例如 我得到的结果类似A和D列,经常一起出现。 B&C经常一起出现。 我曾考虑过使用Apriori算法或简单的相关性,但是在这里找
0
1回复
19

使用S3作为原始数据的数据管道将如何工作?

我目前正在使用AWS S3作为存储原始数据的数据湖,该数据每分钟向指定的存储桶添加约100个项目。 我知道数据管道和数据ETL概念的基础知识,但是我仍然不熟悉这些基础知识,例如什么是Apache Sp
-2
0回复
16

关于概率密度函数,以下哪项是不正确的

关闭。 此问题不符合堆栈溢出准则。 它当前不接受答案。
0
1回复
26

错误:调整参数网格应具有fL列,usekernel列,adjust列。 K折交叉验证

我该如何解决此错误。我尝试自行修复该错误,但没有一个能帮助我解决此问题吗? 我收到此错误:
1
1回复
37

如何检查2D阵列中的每个元素是否连接在一起

问题在标题中。 我有一个二维数组: 如何检查此示例中的每个元素“ 1”是否都横向或横向相邻地连接在一起。 在此示例中,该函数应返回TRUE,因为所有1都连接在一起。 相比之下: 这应该返回FA
0
0回复
05

TFlearn中的variance_scaling_initializer,版本控制

我试图运行此模型来构建RestNet模型: 但是以某种方式我在这里不支持'variance_scaling_initializer'时遇到了这个问题,请在net = tflearn.residua
0
0回复
09

从图像文件获取数据帧并使用pyspark进行PCA

我在几个文件中有数千张jpg图片。 我想在Jupyter Notebook中使用pyspark进行PCA。 我想我之前必须在数据帧中进行转换? 怎么办? 以及如何使用pyspark进行PCA? 谢谢你
0
2回复
36

删除大熊猫中的重复项。 copy()和drop_duplicates()删除仅出现一次的行

如问题所述。 我试图摆脱具有2系列/列df['Offering Family', 'Major Offering']的df中的重复行。 我希望将后续的df与我基于“主要产品”列的另一个df合并,因此

1 2 3 4 5 6 7 8 9 10 下一页