cost 239 ms
基於日期范圍重新索引 Pandas

[英]Reindexing Pandas based on daterange

我正在嘗試重新索引 pandas 中的日期。這是因為缺少日期,例如周末或國定假日。 為此,我使用以下代碼: 此代碼生成此 dataframe: 你能告訴我為什么它不重新索引數據而是顯示 NaN 值嗎? ===編輯=== 會不會是python版本問題? 我在 python 3.7 和 3.10 中 ...

Pandas 重新索引日期索引按組重新訪問

[英]Pandas reindex date index by group revisited

之前有人問過這個問題,這里提出了一個可行的解決方案Pandas reindex dates in Groupby ,這在過去對我有用,但它不再起作用了。 因此,回顧一下,我需要使用日期重新索引 dataframe 以創建“平衡面板”——不要在任何組中缺少日期值組合。 這是一個例子: 所需的 outp ...

在 pandas dataframe 中按列值索引添加不同的前綴

[英]Add different prefix to index by column value in pandas dataframe

我有一個 dataframe,帶有重復索引,我正在嘗試根據另一個 dataframe 的行名重新索引。但是,由於重復索引問題,它告訴我當我執行df2 = df2.reindex(df.index)時cannot reindex on an axis with duplicate labels df2 ...

根據后綴重新索引 dataframe

[英]reindex a dataframe based on suffix

假設我們有一個 dataframe 有 150 行和 47 列。 前兩列始終命名為“名稱”和“國家/地區”。 列的 rest 可能具有不同的名稱,但足夠將始終遵循相同的邏輯。 前 15 個將是 _a,接下來的 15 個將是 _b,最后 15 個將是 _c。 我想創建一個新的 dataframe,它 ...

Elasticsearch 將來自多個索引的數據合並到合並索引中

[英]Elasticsearch merge data from multiple indexes into merged index

我的公司使用開箱即用的軟件,該軟件將日志導出到 Elasticsearch(並使用這些日志)。 該軟件每天為每種數據類型創建一個索引,例如:“A”記錄數據 => A_Data_2022_12_13、A_Data_2022_12_14 等等。因為這種數據存儲方式我們的 Elastic 100GB ...

在同一列中使用小時和日期格式化文件

[英]formating file with hours and date in the same column

我們的電力供應商認為讓他們提供的 csv 文件難以閱讀會很有趣。 這是精確的耗電量,每 30 分鍾一次,但在 SAME 列中有時間和日期,例如: [編輯:這里是 csv 文件的原始版本,我的錯] 我他媽的怎么能得到這種可愛的格式化文件: 等等 ...

遷移數百萬文檔時,使用 elasticcluster 的遠程重建索引 API 的最佳方法是什么?

[英]What is the best approach to use remote reindexing API of elasticcluster when migration millions of documents?

我有大約。 索引中有 1 億個文檔,我想使用 reindex API 將其遷移到新集群。我想以節流方式進行。 我嘗試使用request_per_seconds到100000 ,但完成整個過程需要幾個小時。 Q.1 我可以使用request_per_seconds到1000000來減少處理時間嗎? ...

使用 java 中的 Rest 高級客戶端重新索引選定的 _source 字段

[英]Reindex selected _source fields using Rest high level client in java

我想使用 Rest 高級客戶端重新索引 elasticsearch 中我的文檔中的選定字段。 我知道 elasticsearch 查詢來實現這一點,但我不知道它是使用 rest 客戶端的等效查詢。 以下是我嘗試使用 rest 客戶端實現的 elasticsearch 查詢 - 要在 java 中使用 ...

Pandas:重新索引/合並或重新分配(不同時間戳的)時間序列,無需插值

[英]Pandas: Reindex/merge or re-allocate time series (of different time stamps) without interpolation

我有兩個不同時間序列戳的 pandas 數據幀,我想將它們合並在一起。 第一個 dataframe 是來自 model 的數據,稱為df_model ,第二個是觀察數據,稱為df_obs 。 df_model和df_obs的簡要示例如下: 然后 所以我要做的是通過以下規則(列為偽代碼)合並這兩個 ...

使用其中一列中的鍵對熊貓數據框進行兩列排序,“種類合並排序”,不起作用

[英]Sort pandas dataframe by two columns using key in one of them, "kind mergesort", not working

我正在嘗試按 2 個連續條件col[0]和col[2]對數據幀進行排序,輸入數據如下所示: 我想要的輸出如下所示(按col[0]排序,然后按col[2]排序): 第二個順序是自定義[gene,mRNA,five_prime_UTR,CDS,three_prime_UTR],所以我使用了一 ...

Pandas 將日期重新索引到列表中的日期子集

[英]Pandas reindex Dates To Subset of Dates from List

很抱歉,但是有在線文檔和示例,我仍然不明白。 我有一個帶有日期時間格式(yyyy-mm-dd)的日期索引的pandas df,我正在嘗試根據相同格式(yyyy-mm-dd)的日期子集重新采樣或重新索引此數據幀在一個列表中。 我已使用以下方法將 df.index 值轉換為日期時間: 我嘗試了各種方 ...

在熊貓中,如何在多索引的第 2 級重新索引(填充 0)

[英]In pandas, how to reindex(fill 0) in level 2 in multiindex

我有一個具有 2 級索引的數據框:月份和評級。 評級應該是 1,2,3(不要與列 1,2,3 混淆)。 我發現幾個月來,評級可能會丟失。 例如,(人口和 2021-10)只有等級 1,2。 我需要每個月都有評級 1,2,3。 所以我需要為缺失的評分指數填寫 0。 我該怎么做? 我試過 reinde ...

排序以使 x 與數據框中的 y 匹配

[英]Sorting so that x matches y in data frame

我在一個數據框中有兩列, ID_exp和ID_off 。 我希望ID_off中的訂單與ID_exp匹配。 從我讀過的內容來看,我需要重新索引行才能使其正常工作。 由於我不能簡單地通過升序/降序重新索引,因此我似乎需要一個特定的 while 循環來執行此操作。 我的總體想法是這樣的: 為了澄清, ...

列出熊貓數據框

[英]List to pandas dataframe

我有一個如下列表: 我有一個空的數據框(df2): 我想根據列表中的鍵將列表索引到數據框中,如果它沒有標簽,那么它可以沒有標簽。 我做了這個使用 但是,我收到錯誤消息說它應該有唯一的標簽。 現在從列表中您可以看到道路標簽重復了兩次。 它應該只有一次。 所以我會用相似的鍵連接所有的值,然后 ...

Pandas 使用多索引開始和結束日期重新采樣

[英]Pandas resample with multiindex start- and enddate

假設我有一個具有兩個索引級別的多索引 Pandas 數據框:month_begin 和 month_end 我想要做的是每天對數據重新采樣,以便每月值顯示該月的每一天: 我試圖從第一個索引中檢索月份 但后來我不知道如何判斷它應該每天重新采樣。 有人知道怎么做這個嗎? 非常感謝您的幫助。 ...

使用超過 500000 種產品重新索引 Magento 2

[英]Reindex Magento 2 with morethan 500000 products

我有一個擁有超過 500000 種產品的網站,但由於產品數量比平時高得多,我無法成功地重新索引。 在 SSH 上獲取超時錯誤。 重新索引模式設置為按計划更新。 在這種情況下如何運行重新索引? 尋找解決方案:) 謝謝 ...

“Reindex”只用新值填充前兩行

[英]"Reindex" only fills the first two rows with new values

我是 stackoverflow 的新手。 我希望我能清楚地提出我的問題。 我正在使用reindex來填寫 pandas dataframe 中缺失的日期: output: 做的: 輸出是: 我的問題是:為什么reindex創建新日期(它應該如此)但只將前兩行的值設置為 1000 而不是所有新行? ...

使用新值創建 `pd.Index` 的副本

[英]Create copy of `pd.Index` with new values

示例: pd.DatetimeIndex 例如,假設我有一個pd.DatetimeIndex 我現在想要一個新的pd.DatetimeIndex就像di一樣,但包含值 我可以試試這個 但是請注意freq=None ,所以這不能解決我的問題。 事實上,我什至可以這樣做 編輯(感謝@mozway) : ...

對elasticsearch中的大量數據進行編輯和重新索引(百萬條記錄)

[英]Editing and re-indexing large amounts of data in elasticsearch (millions of records)

我最近為我的 elasticsearch 數據制作了一個新版本的索引,其中包含一些新字段。 我從舊索引重新編制索引,因此新索引包含所有舊數據以及包含新字段的新映射。 現在,我想更新索引中的所有 elasticsearch 數據以包含這些新字段,我可以通過對其他來源進行一些單獨的數據庫 + api ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM