標簽[reindex] - 堆棧內存溢出

[英]Reindexing Pandas based on daterange

我正在嘗試重新索引 pandas 中的日期。這是因為缺少日期，例如周末或國定假日。為此，我使用以下代碼：此代碼生成此 dataframe：你能告訴我為什么它不重新索引數據而是顯示 NaN 值嗎？ ===編輯=== 會不會是python版本問題？我在 python 3.7 和 3.10 中 ...

重新索引 Pyspark Dataframe，每個組的日期為年-周格式

[英]Reindex Pyspark Dataframe with dates in Year-Week format for each group

我有以下 Pyspark dataframe：我想為每個 id1 填寫缺失的日期並獲得如下內容：我從這段代碼開始：主要問題是我的日期采用特定格式“2022-W01”。我找不到快速解決方案 ...

Pandas 重新索引日期索引按組重新訪問

[英]Pandas reindex date index by group revisited

之前有人問過這個問題，這里提出了一個可行的解決方案Pandas reindex dates in Groupby ，這在過去對我有用，但它不再起作用了。因此，回顧一下，我需要使用日期重新索引 dataframe 以創建“平衡面板”——不要在任何組中缺少日期值組合。這是一個例子：所需的 outp ...

在 pandas dataframe 中按列值索引添加不同的前綴

[英]Add different prefix to index by column value in pandas dataframe

我有一個 dataframe，帶有重復索引，我正在嘗試根據另一個 dataframe 的行名重新索引。但是，由於重復索引問題，它告訴我當我執行df2 = df2.reindex(df.index)時cannot reindex on an axis with duplicate labels df2 ...

根據后綴重新索引 dataframe

[英]reindex a dataframe based on suffix

假設我們有一個 dataframe 有 150 行和 47 列。前兩列始終命名為“名稱”和“國家/地區”。列的 rest 可能具有不同的名稱，但足夠將始終遵循相同的邏輯。前 15 個將是 _a，接下來的 15 個將是 _b，最后 15 個將是 _c。我想創建一個新的 dataframe，它 ...

Elasticsearch 將來自多個索引的數據合並到合並索引中

[英]Elasticsearch merge data from multiple indexes into merged index

我的公司使用開箱即用的軟件，該軟件將日志導出到 Elasticsearch（並使用這些日志）。該軟件每天為每種數據類型創建一個索引，例如：“A”記錄數據 => A_Data_2022_12_13、A_Data_2022_12_14 等等。因為這種數據存儲方式我們的 Elastic 100GB ...

在同一列中使用小時和日期格式化文件

[英]formating file with hours and date in the same column

我們的電力供應商認為讓他們提供的 csv 文件難以閱讀會很有趣。這是精確的耗電量，每 30 分鍾一次，但在 SAME 列中有時間和日期，例如： [編輯：這里是 csv 文件的原始版本，我的錯] 我他媽的怎么能得到這種可愛的格式化文件：等等 ...

遷移數百萬文檔時，使用 elasticcluster 的遠程重建索引 API 的最佳方法是什么？

[英]What is the best approach to use remote reindexing API of elasticcluster when migration millions of documents?

我有大約。索引中有 1 億個文檔，我想使用 reindex API 將其遷移到新集群。我想以節流方式進行。我嘗試使用request_per_seconds到100000 ，但完成整個過程需要幾個小時。 Q.1 我可以使用request_per_seconds到1000000來減少處理時間嗎？ ...

使用 java 中的 Rest 高級客戶端重新索引選定的 _source 字段

[英]Reindex selected _source fields using Rest high level client in java

我想使用 Rest 高級客戶端重新索引 elasticsearch 中我的文檔中的選定字段。我知道 elasticsearch 查詢來實現這一點，但我不知道它是使用 rest 客戶端的等效查詢。以下是我嘗試使用 rest 客戶端實現的 elasticsearch 查詢 - 要在 java 中使用 ...

Pandas：重新索引/合並或重新分配（不同時間戳的）時間序列，無需插值

[英]Pandas: Reindex/merge or re-allocate time series (of different time stamps) without interpolation

我有兩個不同時間序列戳的 pandas 數據幀，我想將它們合並在一起。第一個 dataframe 是來自 model 的數據，稱為df_model ，第二個是觀察數據，稱為df_obs 。 df_model和df_obs的簡要示例如下：然后所以我要做的是通過以下規則（列為偽代碼）合並這兩個 ...

使用其中一列中的鍵對熊貓數據框進行兩列排序，“種類合並排序”，不起作用

[英]Sort pandas dataframe by two columns using key in one of them, "kind mergesort", not working

我正在嘗試按 2 個連續條件col[0]和col[2]對數據幀進行排序，輸入數據如下所示：我想要的輸出如下所示（按col[0]排序，然后按col[2]排序）：第二個順序是自定義[gene,mRNA,five_prime_UTR,CDS,three_prime_UTR]，所以我使用了一 ...

Pandas 將日期重新索引到列表中的日期子集

[英]Pandas reindex Dates To Subset of Dates from List

很抱歉，但是有在線文檔和示例，我仍然不明白。我有一個帶有日期時間格式（yyyy-mm-dd）的日期索引的pandas df，我正在嘗試根據相同格式（yyyy-mm-dd）的日期子集重新采樣或重新索引此數據幀在一個列表中。我已使用以下方法將 df.index 值轉換為日期時間：我嘗試了各種方 ...

在熊貓中，如何在多索引的第 2 級重新索引（填充 0）

[英]In pandas, how to reindex(fill 0) in level 2 in multiindex

我有一個具有 2 級索引的數據框：月份和評級。評級應該是 1,2,3（不要與列 1,2,3 混淆）。我發現幾個月來，評級可能會丟失。例如，（人口和 2021-10）只有等級 1,2。我需要每個月都有評級 1,2,3。所以我需要為缺失的評分指數填寫 0。我該怎么做？我試過 reinde ...

排序以使 x 與數據框中的 y 匹配

[英]Sorting so that x matches y in data frame

我在一個數據框中有兩列， ID_exp和ID_off 。我希望ID_off中的訂單與ID_exp匹配。從我讀過的內容來看，我需要重新索引行才能使其正常工作。由於我不能簡單地通過升序/降序重新索引，因此我似乎需要一個特定的 while 循環來執行此操作。我的總體想法是這樣的：為了澄清， ...

列出熊貓數據框

[英]List to pandas dataframe

我有一個如下列表：我有一個空的數據框（df2）：我想根據列表中的鍵將列表索引到數據框中，如果它沒有標簽，那么它可以沒有標簽。我做了這個使用但是，我收到錯誤消息說它應該有唯一的標簽。現在從列表中您可以看到道路標簽重復了兩次。它應該只有一次。所以我會用相似的鍵連接所有的值，然后 ...

Pandas 使用多索引開始和結束日期重新采樣

[英]Pandas resample with multiindex start- and enddate

假設我有一個具有兩個索引級別的多索引 Pandas 數據框：month_begin 和 month_end 我想要做的是每天對數據重新采樣，以便每月值顯示該月的每一天：我試圖從第一個索引中檢索月份但后來我不知道如何判斷它應該每天重新采樣。有人知道怎么做這個嗎？非常感謝您的幫助。 ...

使用超過 500000 種產品重新索引 Magento 2

[英]Reindex Magento 2 with morethan 500000 products

我有一個擁有超過 500000 種產品的網站，但由於產品數量比平時高得多，我無法成功地重新索引。在 SSH 上獲取超時錯誤。重新索引模式設置為按計划更新。在這種情況下如何運行重新索引？尋找解決方案:) 謝謝 ...

“Reindex”只用新值填充前兩行

[英]"Reindex" only fills the first two rows with new values

我是 stackoverflow 的新手。我希望我能清楚地提出我的問題。我正在使用reindex來填寫 pandas dataframe 中缺失的日期： output：做的：輸出是：我的問題是：為什么reindex創建新日期（它應該如此）但只將前兩行的值設置為 1000 而不是所有新行？ ...

使用新值創建 `pd.Index` 的副本

[英]Create copy of `pd.Index` with new values

示例： pd.DatetimeIndex 例如，假設我有一個pd.DatetimeIndex 我現在想要一個新的pd.DatetimeIndex就像di一樣，但包含值我可以試試這個但是請注意freq=None ，所以這不能解決我的問題。事實上，我什至可以這樣做編輯（感謝@mozway）： ...

對elasticsearch中的大量數據進行編輯和重新索引（百萬條記錄）

[英]Editing and re-indexing large amounts of data in elasticsearch (millions of records)

我最近為我的 elasticsearch 數據制作了一個新版本的索引，其中包含一些新字段。我從舊索引重新編制索引，因此新索引包含所有舊數據以及包含新字段的新映射。現在，我想更新索引中的所有 elasticsearch 數據以包含這些新字段，我可以通過對其他來源進行一些單獨的數據庫 + api ...