cost 101 ms
在 Stata 上获取缺失值的两个变量之和 - Getting the sum of two variables on Stata with missing values

我如何generate一个新变量,它给出两个变量( msf_n_4weeks和msm_n_4weeks )的总和,但如果变量的两个值都缺失,则只分配一个缺失值。 变量有缺失值,也有 0 作为值。 我使用了下面的代码,它将值0分配给那些总和为 0 的变量,也分配给那些两个变量都缺少值的变量。 相反,我 ...

2023-06-07 17:23:57   2   21    stata  
面板数据的横截面(Stata)“面板内的重复时间值” - Cross-sectional to panel data (Stata) "repeated time values within panel"

我对 Stata 比较陌生,我目前有一个横截面格式的 Reddit 数据集,每一行代表一个用户名给定的 Reddit 帖子,一些用户名每天发布几次,而其他用户名在整个数据集中只发布一次/两次. 我有兴趣运行Heckman选择 model,所以我试图将数据转换为面板格式,我为每个用户名创建了一个 I ...

将两个数据集与一个对应观察值中的变量合并到另一个数据集 - Merging two datasets with variables in one corresponding observations in the other

我今天遇到了一个挑战,希望能得到一些帮助。 我想merge 2 个数据集。 Dataset1 包含具有 3 个变量的成员花名册,批次中的 batch_id、member_num 和职业。 Dataset2 由成员许可证状态组成。 这里的挑战是,在 dataset2 中,member_num 被表 ...

如何存储统计利润率估计的置信区间? - How to store confidence intervals from stata margins estimation?

统计专家, 我一直在努力寻找一种方法来存储边际估计,包括 p 值和置信区间。 下面是我的代码。 我所能得到的只是变量 I 的估计边际效应。看起来我不能像我们可以为通常的回归模型做的那样指定“ci”。 有没有一种方法可以存储和显示边际估计中的其他数字? 另一个相关问题是:如何保存交互项的边际估计? ...

Append 目录中的所有数据 - Stata - Append all data in a directory - Stata

我想把append all.dta数据放在一个目录下。 数据集的名称中有四个常见的字符串字符“GTAH”。 我尝试创建所有数据的列表并将其保存为 txt 文件,然后循环并附加列表中的数据集。 我的代码的某些部分工作但从循环 function 中得到错误。代码已使用,错误消息如下: 错误信息 -找不 ...

2023-02-01 00:20:01   1   21    stata  
将多行合并为一个观察 - Combine several rows into one observation

我在 Stata 中有一个数据集,其中一个观察结果分布在多行中,如下表所示。 变量是除 id 之外的字符串,并且某些变量存在一些重复条目(如表中的最后一行)。 ID 变种1 变量2 变量3 1个姓名1 1个名字2 1个名字3 2个姓名4 2个名字5 3个名字6 3个名字8 3个名字 ...

2023-01-30 16:07:04   2   43    stata  
我想创建一个表来报告使用不同变量的两个独立回归的结果 - I want to create a table reporting results from two separate regressions using different variables

我对相似但不同的数据集和回归变量进行了两次回归,我想将它们的结果并排报告以实现可比性,但使用 estout/esttab 将它们保存在一个表中。 成品应该看起来像这样。 我可以像这样创建单独的表,但老实说我不知道从哪里开始,而且文档也不是很有帮助。 我希望这里有人能指出我正确的方向。 ...

2023-01-29 10:10:54   1   31    stata  
希望优化 R 中的 mutate(case_when( )) function,在系统命名的变量列表中需要相同的突变 - Looking to optimize a mutate(case_when( )) function in R, with the same mutations required across a list of systematically named variables

我试图在 R 中找到一种矢量化的通用方法来完成我通常使用 Stata 的任务。 我有一个具有共同结构的变量列表,我希望有效地对所有变量应用相同的转换。 每个变量有两个版本(x 和 m),如果观察分别位于第 1 组或第 2 组,则每个变量只有一个值(一些是数字,一些是字符)。 我正在尝试创建一个通用变 ...

为多个变量的所有条目计算过去条目的标准差 - Calculating standard deviations of past entries for all entries for multiple variables

我的数据集如下所示: 我想生成变量来测量输入前 90 天 window 变量的标准差。 例如,我想要一个变量,它告诉我在 2023 年 1 月 26 日之前的 90 天内,变量 1 的条目的标准差是 x。 我希望针对每个变量的每个观察结果。 我不需要前 90 个条目的 sd。 此外,我有大量变量,因 ...

2023-01-26 11:26:03   1   23    loops / stata  
R 循环回归模型的代码,从 Stata 代码开始 - R code for looping through regression models, starting from Stata code

来自 Stata 的新用户 R。 我的大部分工作包括运行多个具有因变量和自变量的不同组合的回归模型并存储结果。 为此,我大量使用了宏和循环,据我所知,这在 R 中不是首选。 以“mtcars”数据集为例,假设我有兴趣在 Stata 中使用mpg 、 disp和wt作为因变量, hp和car b 作为 ...

将来自 Stata 的 xtabond 调用翻译成 R - Translating xtabond call from Stata to R

我正在尝试复制特定研究的结果。 该研究使用 Stata 中的xtabond命令来运行具有因变量滞后的 Arellano-Bond 估计器。 该研究的目标是评估 N 单位处于 4 年周期(周期重复 50 年)的第 X 年的影响。 Stata中的调用是: 我们已经在 R 中尝试了几个包,包括 pgm ...

如何获得一组变量中“是”值的数量 - How to get the number of "yes" values across a group of variables

我在 Stata 中有一个数据集,其中包含有关参与者是否经历过特定副作用的信息。 该数据集包含大约 900 名参与者,并且为每个参与者捕获了 20 种副作用。 每个副作用的值为“0”表示参与者没有经历过副作用,“1”表示参与者确实经历过副作用。 我想为每个参与者计算“1”的数量,并最终总结经历一种副 ...

使用日期范围 - 在面板中创建一个标志 - Working with date ranges - creating a flag in panel

我有两个数据集: 面板 - 从 2010 年到 2020 年每个公司(一个或多个)在获得贷款时的范围 - 该范围还表示贷款期限首先可以是这样的(每个公司都有所有的年度观察记录): 第二个可以是这样的(所以各种各样,一家公司可以有所有年的贷款,在开始和结束时都有一些差距): 想法是将两者merge , ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM