标签[panel-data] - 堆栈内存溢出

R：从另一个 dataframe 中将值填充为所选列的平均值（步长 = 12） - R: fill values to columns as mean of selected columns (step = 12) from another dataframe

我有一个 dataframe 的气候数据观测值，从 1980 年 1 月到 1990 年 12 月不等。数据集如下所示：我的目标是获得一个数据集，其中前 4 列与原始数据集中的列相同，而 rest 是所有年份的月平均值。由于每个月的均值计算为每12列（全部）的平均值，所以我大致想到了使用列 ...

将来自 Stata 的 xtabond 调用翻译成 R - Translating xtabond call from Stata to R

我正在尝试复制特定研究的结果。该研究使用 Stata 中的xtabond命令来运行具有因变量滞后的 Arellano-Bond 估计器。该研究的目标是评估 N 单位处于 4 年周期（周期重复 50 年）的第 X 年的影响。 Stata中的调用是：我们已经在 R 中尝试了几个包，包括 pgm ...

使用面板调查数据时，如何只包含每个人 ID 一次？ - How can I include every person ID only once when using panel survey data?

我有一个超过 30 年的调查数据的数据集。数据框中的每个参与者都有一个个人 ID。关于这个数据集，我有两个问题。首先，如何打印不同个人ID的数量，即观察到多少个不同的人？其次，在对所有观察结果进行回归分析时，如何确保每个人只包括一次？到目前为止，我只进行了一年的调查，但这严重限制了我的样 ...

根据条件从 R 的另一行中提取值的简单快速循环？ - Easy and quick loop to extract values from another row in R, based on condition?

我正在使用个人标识符不可用的面板数据集。相反，我拥有的是跨波固定的家庭标识符（变量nquest ）、跨波变化的每个家庭中的个人标识符（变量nord ）以及参考前一波中变量nord值的个人标识符（变量nordp ）。所以，一个简化的 dataframe 看起来像这样：排年探索北方北德普 1个 ...

与 R 上面板数据集的差异差异 - Diff in Diff with panel dataset on R

我有一个面板数据集，我想对其进行差异比较。现在这是我的回归：但这会使 R 假设每个观察值彼此独立吗？如果是，如何让R意识到这是一个面板数据？ ...

R面板数据如何取多年平均值？ - How to take the average over multiple years in panel data in R?

我的数据集如下所示（完整数据集包含世界上所有国家/地区）：现在我想取每个国家的 population_g 的平均值，并将其放在同一数据集中的新列中。有人可以帮我创建这个新列，其中包含每个国家 5 年 population_g 的平均值吗？所以我想得到一些东西：阿富汗 2017（所有以前的变 ...

如何在 R 中创建特定年份的面板数据子集？ - How do you create a subset of panel data with certain years in R?

我的面板数据如下所示：第 1 步 = 完成现在我想创建一个新的面板数据集，使其包含我之前数据集中的每个国家/地区，但仅包含 2017、2018、2019、2020 和 2021 年。我想要这个是因为我想添加一个新列，其中包含某些变量的平均值（过去 5 年，2017-2021 年），例如我数据集 ...

如何开始使用时间固定效应？ - How to get started with Time Fixed Effects?

我们有一个时间序列数据集，我们想在四个波中检查时间固定效应，但是我们在开始时遇到了麻烦。有没有人有关于如何使用面板数据以及我们如何检查时间固定效应的指南？我们尝试使用plm和lm包。这是我们一直在使用的代码之一：但它并没有给我们太多。我们也用过这个，但我们不确定它的形式是否正确：我们正 ...

R如何展开连续计数？ - How to expand and count consecutively in R?

如何扩展数据集并按年连续计数？具体来说，我的数据集有 15 行和 4 列：公司 ID、行业代码、年份和月份。该数据在 2 年内有 15 个月度信息。在该月观察到一家采取月度行动的公司。如果每个月都观察每家公司，我就会有 30obs。我想扩展数据，以便将未采取每月行动的公司记录为 0，将采 ...

使用连续 x 轴的带有面板数据的 ggplot - ggplot with panel data using a continuous x-axis

我想制作面板数据图。我将面板数据包含在 dput() 中。我遇到的问题如下。我希望每个日期都用 ggplot 显示在 x 轴上，而不是像往常一样显示估计值。因此我使用：然而，显然它遇到了 x 轴的问题，因为 x 轴是面板数据，因此重复它的值。我该如何解决这个问题？ ...

PanelMatch R 错误：“请将时间 ID 转换为连续整数”和“请将单元 ID 列转换为 integer 或数字” - PanelMatch R Errors: "please convert time id to consecutive integers" and "please convert unit id column to integer or numeric"

在R中使用PanelMatch package 时，出现了几个错误。任何有关如何解决这些问题的指导将不胜感激。首先，当运行DisplayTreatment() function 时，出现以下错误：“请将时间 ID 转换为连续整数”。我已经使用as.integer(year)将时间 ID 转换 ...

我应该用什么方法来研究人口水平增长和个体水平增长？ - What method should I use to study population level growth and individual level growth?

这个问题是从 Stack Overflow 迁移过来的，因为它可以在 Cross Validated 上回答。 24 天前迁移。我有一个面板数据集，其中包含 88 棵树的直径测量数据，这些树是从 Duke Forest 的一个地图林中获得的。变量的描述是：每棵树都有一个唯一的 ID（ID） ...

对面板数据的“部分”进行回归 - Run a regression on "portion" of Panel data

我正在处理从 2020 年 2 月 3 日到 2020 年 5 月 29 日的面板数据。为了检验我的假设，我需要在整个期间以及另外 3 个不同的时间段运行相同的回归： 03.02.2020 至 21.02.2020 24.02.2020 至 10.04.2020 13.04.2020 至 29 ...

在 R 中创建具有其他列值的列 - Creating a column with value of other columns in R

我的数据集子集如下所示（完整数据集包含世界上所有国家/地区）：我想创建一个新列，只显示每个国家 2001 年的债务。我的意思是，前 26 行将显示 1996 年至 2021 年间阿富汗的债务价值，接下来的 26 行将显示下一个国家/地区。我这样做是为了 1996 年的初始债务，但我不知道如何改 ...

在 R 中创建和转置面板数据 - Creating and transposing panel data in R

目前，我拥有从阿富汗到津巴布韦的世界上每个国家从 1996 年到 2021 年的以下数据集（完整数据集很难用图片显示）：数据 1 我想以面板数据形式获取数据，如下所示：所以，我想将变量 Country、Year 和 Central Government Debt 作为列。然后所有国家（从图中可以 ...

R - 创建事件时间变量 - R - Create Event Time variable

我正在使用看起来像这样的面板数据。现在我想创建一个事件时间指示器来测量自第一个事件以来的时间，如下所示。我已经尝试了下面发布的链接中的解决方案，但无法使其适用于我的情况。特别是我努力让它计算上面指定的事件发生后的时间。如果您对我应该尝试什么有任何建议，请告诉我。创建事件变量的时间和时间 ...

面板内的重复时间值 (r451) - repeated time values within panel (r451)

我真的是 Stata 的新手，我正在尝试使用面板数据。我知道，要设置面板数据，可以使用 xtset id year，但是当我尝试使用此命令时，Stata 会返回错误“面板内的重复时间值 (r451)”。我知道发生这种情况是因为我在同一年重复了相同的 ID（例如 Mark 在 2011 年多次出 ...

在 Python 中，是否有一种方法可以为面板中的实体估算平均值（或内插线性值），但只有在并非所有值都缺失时才有效？ - In Python, is there a way to impute average values (or interpolate linear values) for entities in a panel, but only when not all values are missing?

我有一个关于面板数据插补的问题。简而言之，我希望根据相关实体的其他年份来估算具有缺失值的年份的值。因此，当我没有该实体的任何非缺失数据时，我不想估算值。这里的例子使用插值，但我也想知道如何使用平均值。我使用的插值方法似乎为所有情况估算数据，这让我怀疑这是否也是针对每个实体完成的。请参见下 ...

pivot_longer 命令的问题 - Issue with pivot_longer command

我正在尝试使用更长的 pivot 将长数据集转换为宽集，列标题为“Program ID”和“Participant_Count_22”、“Participant_Count_21”、“Participant_Count_20”、“Participant_Count_19”，为期四年 2019-202 ...

对于 MultiIndex 级别 0 中的每个唯一索引值，如果另一列中的值（字符串）不唯一，则打印索引 - For each unique index value in MultiIndex level 0, print index if values (strings) in another column are not unique

我正在使用如下所示的面板数据（仅包括相关列）：代码（MultiIndex 的第 0 级）用于识别面板中的单个和唯一单元。每个单元的观察时间超过 3 年（MultiIndex 的第 1 级）。当我groupby('Industry')时，我最终会重复计算单位，因为同一个股票代码与多个行业相关联（ ...