
[英]1D histogram from 4 column txt dataset in python?
我有一个包含 4 列的文本文件,前 3 列是一个数据点的 x、y 和 z 坐标,第 4 列是该 x、y、z 坐标集处的数据点的值。 例如: 我想制作一个 plot,其横轴为 x 坐标值,纵轴为该位置的 TOTAL 值(x 坐标值)。 这基本上是上面.txt 数据集的 y 和 z 的边缘化直方图。 ...
[英]1D histogram from 4 column txt dataset in python?
我有一个包含 4 列的文本文件,前 3 列是一个数据点的 x、y 和 z 坐标,第 4 列是该 x、y、z 坐标集处的数据点的值。 例如: 我想制作一个 plot,其横轴为 x 坐标值,纵轴为该位置的 TOTAL 值(x 坐标值)。 这基本上是上面.txt 数据集的 y 和 z 的边缘化直方图。 ...
[英]How to properly figure out all possible "long entries" made based on the OHLC data and upper bound and lower bound price series? Pandas related
假设您有一个 Pandas df ,其中包含特定金融资产的 OHLC(开盘价、最高价、最低价、收盘价的缩写)价格。 此外,您还需要考虑另外两个 Pandas 数据框,其中一个称为upper_bound ,其中包含一系列高于收盘价的价格,另一个称为lower_bound ,其中包含一系列低于收盘价的价 ...
[英]how to transcope a part of column as rows in pandas
我有一些患者的数据,他们的配置无法用于数据分析我们有几个患者,每个患者都多次访问我们的诊所。 因此,在我们的数据中,我们有一行访问,它包含一些数据,正如我提到的,每个患者都有多次访问。 所以我有一个病人的多行。 例如,我想要一种方法,我们可以只为一个病人设置一行,而为每次访问设置多个变量在此处输入图 ...
[英]Draw lines in a 3-d scatter plot
我有一个 3d 散点图 plot。我想画两条线来描述 2021 年和 2022 年的点。有什么办法可以在 matplotlib 中做到这一点? 我会附上我希望它看起来像。 黑线是我需要的。 我试着问 chat gpt,但它不明白我想做什么。 ...
[英]'4/20/22, 4:08 PM - ', how to format this date using python
我没有得到它在每个日期显示NAT的值 position 我使用的代码: ...
[英]How to find smallest cluster of location which are within a given distance
我有一组经纬度格式的坐标。 我需要从这些坐标中找到最小的簇,这些坐标之间的距离在 50 英里以内。 我是数据科学的新手,如何在不使用 sklearn 库的情况下在 Python 中实现它。 ...
[英]Masking the Zip Codes
我正在上一门课程,我需要解决以下作业:“在这部分,你应该编写一个 for 循环,更新 df_users dataframe。 Go 通过每个用户,并更新他们的 zip 代码,以符合安全港规范: 如果用户来自“地理细分”小于等于 20,000 的 zip 代码,请将 df_users 中的 zip ...
[英]nltk.download('punkt') giving output as false
当我尝试安装 nltk 并使用 nltk.download('punkt') 下载文件 punket 时。 我收到以下错误。 尝试了许多替代代码和 changing.networks。 错误请帮忙解决这个错误。 申请后:- = df['num_words'] = df['text'].apply(l ...
[英]Can I use the output of tf.keras.utils.image_dataset_from_directory to train an autoencoder?
简而言之,我希望能够使用从本地图像目录创建的 keras 数据集来训练自动编码器。 澄清一下,这是一个 model,它近似于图像的身份 function:理想情况下,output 与输入完全相等。 数据集太大,无法放入 memory,因此使用 np.concatenate 将数据集转换为 nump ...
[英]How to count text event type and transform it into country-year data using pandas?
我正在尝试转换一个 dataframe,其中每一行都是一个特定的事件,每一列都有关于该事件的信息。 我想把它变成数据,其中每一行都是一个国家和年份,其中包含有关给定年份事件的数量和特征的信息。在这个数据集中,每个事件都是恐怖主义的发生,我想计算“目标”是政府大楼的事件数量。 其中一列称为“targ ...
[英]Make Certain Points in Plotly Express Scatterplot different Colors
目前,我有一个散点图,每个点代表一位导演,基于他们的制作预算和利润。 我想突出其中一些以自己独特的颜色脱颖而出的点,并创建一个图例来说明这些点中的每一个是谁。 例如,我想突出显示 Joe Russo,方法是在图表上将他的点设为绿色,然后将他添加到图例中。 现在,我有很好的散点图。 这是我当前的代码 ...
[英]How to convert "event" data into country-year data by summating information in columns? Using python/pandas
我正在尝试转换一个 dataframe,其中每一行都是一个特定的事件,每一列都有关于该事件的信息。 我想把它变成数据,其中每一行都是一个国家和年份,其中包含有关给定年份事件的数量和特征的信息。在这个数据集中,每个事件都是恐怖主义的发生,我想总结列 nkill、nhostage 和 nwounded ...
[英]Python how to create a dictionary using the values in multiple pandas dataframe columns as tuple keys and a single column as value
我想创建一个字典,使用 pandas 数据框中的多列值作为元组键,单列值作为值。 如果特定元组对没有值,我想分配一个通用值,比如 99999。这后一部分被证明是一个挑战,我希望从这个论坛寻求帮助,了解如何完成这项任务。 谢谢你。 示例提取数据: 期间(天) 工厂仓库销售网点产品远程事实仓库 0 1 ...
[英]ı writing data process pipeline with luigi but ı get error
我在我的终端中使用这个命令运行这个 python 文件 和错误 我在终端中写了同样的命令,我得到了这个错误 当我将 output() 方法添加到需要 function 的 DownloadData 时,我收到此错误 ...
[英]non-numeric argument to binary operator is the error i am getting
mean/(as.numeric(s)/sqrt(n)) 错误:二元运算符的非数字参数 sd^2 错误:二元运算符的非数字参数我需要所有这些计算值,如s和y_bar用于我以后的计算。 ...
[英]how to plot top k rows by a given column as a bar plot in FacetGrid (with code dummy data and solution in matplotlib)
任务是 plot NBA 前 5 名球员根据累计得分,作为 plot 的酒吧,并比较东西方球员我在 matplotlib 中实现了解决方案,但我想知道如何使用 FacetGrid 来实现 此代码创建与我拥有的相同的假数据,并使用 matplotlib 创建我想要的图形。我如何使用 FacetGri ...
[英]In a scatterplot, how do I plot a line that is an average of the all vertical coordinates of datapoints that has the same x coordinate
我想要如下图所示的图,其中蓝线是通过绘制具有相同 x 坐标值的数据点的所有 y 坐标值的平均值生成的平均线。 我试过下面的代码 并且,得到如下所示的图,这显然不是我想要的。 ...
[英]Data collection frequency strategy
我有一个问题,我想知道是否有人有效地解决了这个问题。 我正在开发一个收集器(我们称它为 A)以从源(我们称它为 B)收集数据,该源又从其他地方收集数据。 B每5分钟收集一次,A应该使用什么频率或策略? 如果 A 的频率是 B 的两倍,那么它将以一个间隔的重复数据结束。 如果它与 B 相同,那么如果 ...
[英]MySQL fill NULL row with value based on the nearest value in another row
我正在尝试根据以下逻辑更新scores表中的行: 获取没有score的 id 的feat_sum 。 对于每个具有feat_sum score的 feat_sum,获取具有最近的feat_sum和score的行,然后将score字段更新为该分数。 如果feat_sum差异相同,则选择较小的分数 id ...
[英]How to use pythons in operator in a dataframe to search for a string and return boolean in a new column in the same dataframe
我有一个包含电影数据的 dataframe df。 . 我想在 df 中创建一个名为“drama_movie”的新列,其中包含的电影是 Dramas 的值为 True,如果不是,则为 False。 我尝试使用以下代码: df["drama_movie"]=df['listed_in'].isin ...