标签[missing-data] - 堆栈内存溢出

使用 lavaan 在多级结构方程 model 中按组查看结果 - Looking at results by group in multilevel structural equation model using lavaan

我正在尝试使用包含来自 32 个不同国家/地区的观察结果的数据集来构建多级结构方程 model。我按国家/地区对 model 进行了聚类。 model 运行，但在 output 上它表示有 29 个集群。是否有一种方法可以检查正在删除哪些集群以及列表删除在何处删除案例？我预计 output ...

用两列相除的平均和乘以一列减去前一列来填充一列的空值 SAS - fill the nulls of a column with the mean sum of the division of two columns multiplied by one column minus the previous column SAS

我需要用两列相除的平均值乘以一列和 rest 来填充一列的空值一个例子是好吧，我希望 B_01 列的缺失值为 (2/5 + 3/7 + 3/9) / 3 * 其对应的 A 列 B_02(3/5 + 1,2/7 + 0,3 /9)/3 * 其对应的A列——他在B_01中的新值我考虑过这样做，但事 ...

为缺失数据添加 0 而不是排除 matlab 中的类别 - Adding 0 for missing data rather than excluding the category in matlab

我有以下两张数据表，一张名为data1，另一张名为data2。左列是分类变量，右列是频率右侧频率列中的“0”。为了更清楚，我将用一个例子来解释。在 data1 中，左侧列中缺少 8 12 和 13。我希望 matlab 重新创建此表，但 8、12 和 13 的值为 0，因此它看起来如下。我 ...

在 Web 中用 NA 替换缺失值用 R 抓取 - Replace Missing Values with NA in Web Scraping with R

我第一次尝试使用 web 和 R (rvest) 进行抓取。我正在尝试用“NA”替换缺失值，但它似乎根本不起作用。你们可以检查下面的代码，请帮助我吗？某些电影缺少证书和总值。我尝试了以下方法用 N/A 替换缺失值他们都不适合我。命令执行时没有错误，但不会用 NA 替换缺失值，我得到的条目 ...

为什么 map_df 会产生很多缺失值？我如何跨行连接以删除 NA？ - Why does map_df produce many missing values? How can i concatenate across rows to removing NAs?

我试图计算有多少学生在他们的学科中获得了 1s、2s、3s、4s 和 5s，我想要一个列用于每个学科和可能的等级（math_1、science_2 等）。我最初写了一个 for 循环，但我的实际数据集有太多情况，我需要使用 map。我可以让它工作，但它会产生很多 NA，并且每列只有一个块有实际数 ...

使用来自其他列的信息填充数据集中的缺失值 - Fill missing values in a dataset with information from other column

我在 python pandas 中有一个数据集，其中缺少变量 Engine_model 的值，但我有其他行具有相同的信息。据我所知 Car_model 发动机_型号 BMW 5 A 型 Renault 21 B 型 BMW 5 NaN Hyunday Santro 型 C 例如，在这里我有一个 ...

在 r 中检查逻辑变量之和是否大于 n，使用 na - checking if sum of logical variables is greater than n, with na, in r

我有一个带有 5 个二进制变量（ TRUE或FALSE ，但为方便起见表示为0或1 ）的 dataframe ，它们可能有缺失值：df <- data.frame(a = c(1,0,1,0,0,...), b = c(1,0,NA,0,1,...), ...

R：如果良好的输入持续存在于数据中，则填充缺失值 - R: Fill the missing values if good inputs persist in data

想象一个数据集：或者，用于视觉表示的相同数据集：核心列是 Client_ID 和 Year。例如，亚历克斯·史密斯 (Alex Smith) 有两个 2022 年的输入。请问您能否建议一些好的方法：删除具有更多缺失值的行找出缺失数据不同的重复行，看一下（看有没有错误），然后去掉数据较少的行 ...

ggplot：对时间序列中缺失的数据进行着色 - ggplot : shading missing data in time series

我正在不同站点的 ggplot 中绘制时间序列。对于每个站点，我都缺少与响应变量中的零不同的数据（即不受监控的天数，NA）。这些缺失的日期没有出现在我的数据集中，它只包含努力行。 ggplot 中是否有一种方法可以遮蔽努力区域，知道每个站点的缺失日期都不相同（即情节的每个方面都有所不同），或者 ...

Dataframe 向前填充直到列特定的最后一个有效索引 - Dataframe forward-fill till column-specific last valid index

我如何 go 来自：到：我目前的方法是应用一次在一列上工作的自定义方法：但这对我来说似乎有点矫枉过正。是否有直接在 dataframe 上运行的单行程序？关于接受的答案的注释：请参阅下面mozway接受的答案。我知道这是一个很小的 dataframe 但是： ...

当缺少一些年份的数据时，如何计算 R 的百分比变化？ - How to calculate percent change in R when there are some years of data missing?

我正在计算入学率从学年到学年的百分比变化，但有些学年缺少数据，所以我不希望它计算这些实例中的变化并将其保留为空白而不是计算两年区别。我有很多年、学校和团体来做这件事。下面的示例数据框和我当前使用的代码。所以我在这个例子中遗漏了 2016-17 并且不想为 17-18 计算它。 ...

缺失数据填充，用均值填充 - Missing data fills, fill with the mean

我有一个数据集，其中一列对应于分类数据，分别是 A、B、C、D 和 E，所有这些类别都对应于测试分数，其中一些分数是 NaN 值。在这种情况下，我想用成绩的平均值来填补这些缺失值中的每一个。如果我可以只使用 fillna()，这会容易得多，但是类别都是关于成绩的。非常感谢您的帮助。所以我想要 ...

我们怎样才能让 pandas 默认处理缺失值警告它们的存在而不是默默地忽略它们？ - How can we make pandas default handling of missing values warn of their presence rather than silently ignore them?

正如此处所讨论的，pandas 在计算总和时将NaN值默默地替换为 0，这与此处所示的显式计算形成对比：import pandas as pd import numpy as np np.NaN + np.NaN # Result: n ...

在 R 中，如何合并或填充带有 NA 的行“向上”以使数据完整 - In R, how can I merge or fill rows with NA "up" to make data complete

我有非常不清楚的数据，但我一直在整理它。我现在的情况是每两行是完整的数据，应该是一行，但每一行都包含 NA 并且没有键。一个例子：所以我们看到类似的东西： |姓名...年龄...性别 | |史蒂夫....NA ...... NA |不适用........ 26........ M 但我需 ...

Python中a dataframe多列缺失值处理 - Dealining with missing values in multiple columns of a dataframe in Python

我正在处理一个巨大的 dataframe，它有数百列，每列都可能缺少值。这是示例：为了一次处理缺失值，我正在做这样的事情。基本上，如果缺失值位于 a、b 或 c 列之一，那么我会将它们替换为特定值。我想做的是，如果除了这三列之外的任何其他列中都缺少值，则只需将缺失值替换为该列中最常出现的值。 ...

删除以特定名称开头的列的所有缺失值的行 dataframe Julia - Remove rows with all missing values for columns that start with certain name in dataframe Julia

我有以下 dataframe：我想删除缺少所有值的行，但只删除列名称中以“V”开头的列。这意味着应该删除第 2 行和第 6 行，因为它们在以“V”开头的列中缺少所有值。所需的 output 应如下所示：所以我想知道是否有人知道如何删除 dataframe Julia中以特定列名开头的列之间 ...

时间序列股票数据在 dataframe 中有差距，将在 Pycaret 中建模 - time series stock data having gaps in dataframe to be modeled in Pycaret

我有一个 csv 文件，我按如下方式导入：这是一个 dataframe 时间序列，即从 2013 年到 2022 年每年大约有 252 个交易日的股票数据缺少值的数据，我的数据集每年有 252 天的股票数据，而不是连续的 366/365 天什么是替代解决方案，我应该如何在 Pycaret 时间序列 ...

线性插值 - Linear interpolation

我正在处理一个数据集，其中包含许多国家/地区的 GDP 和人均 GDP 列。这些列包含缺失值。由于数据的性质，我希望使用线性插值来填充缺失值而不丢失数据的一般形状。我的代码如下所示：然而，当我运行它时，缺失值仍然存在于我的数据集中，但是我找不到我的代码的问题。 ...

抓取和计算 div 标签内丢失的文本 - Scraping and accounting for missing text inside div tags

我想抓取 3 个相同的 class 这个网站的 div 标签： https://www.riotgames.com/en/work-with-us/jobs ，这里是标签：如您所见，第二个 div 标签之间没有文本，我想捕捉它并将其替换为 N/A，例如，这是我的代码：如您所见，我很糟糕，真的想不 ...

计算 pandas 数据框中多列的变化率 - calculate rate of change for multiple columns in pandas data frame

附件图像是一个测试数据，其中包含多列缺失值。我需要通过计算前 12 个月的变化率来填补缺失值例如：在附加的数据集中，我在第 23 行和第 24 行中缺少 weight_a、weight_b、weight_c 列中的缺失值，以填充第 23 行中的缺失值，weight_a 列我需要做 =(B22-B ...