[英]How do I identify and extract events from a time-series dataframe?
我有一個時間序列數據集,如下所示:時間序列在我將數據集導入 Python 中的 pandas dataframe 之后,我想: 將所有高於零的增長識別為單個事件計算每個事件的曲線下面積存儲區域的值以及事件的開始時間和結束時間關於我如何處理這個問題的任何指示? 我對無監督學習有一點經驗。 但是,我什 ...
[英]How do I identify and extract events from a time-series dataframe?
我有一個時間序列數據集,如下所示:時間序列在我將數據集導入 Python 中的 pandas dataframe 之后,我想: 將所有高於零的增長識別為單個事件計算每個事件的曲線下面積存儲區域的值以及事件的開始時間和結束時間關於我如何處理這個問題的任何指示? 我對無監督學習有一點經驗。 但是,我什 ...
[英]Why i'm having this argument type 'int' is not iterable error on dataframe querying?
dataframe 是這樣的: **當我在 query() function 上對我的數據嘗試此語句時,它給了我一個類型錯誤:** 為什么會發生這種情況以及防止這種情況發生的任何想法? 我的目標是檢索廣場 ID 為 5 且查詢中有特定日期的數據我嘗試重寫語句 5 次,它給了我同樣的錯誤,日期檢 ...
[英]How to subtract date with an integer and generate new columns based on its value
比方說我有一列 'MEMBERSHIP_LENGTH',其值為 integer 例如,值為 100 表示此 ID 已成為會員 100 天。 我想知道這個id從今天開始申請會員的日期。 所以我在想的是 但我收到錯誤 TypeError: timedelta days component: Series ...
[英]How to apply multiple conditions in a dataframe
在應用條件然后將值應用於該特定值時,我確實遇到了問題。 我只是練習數據集的新手。 我的問題是我需要為那些“數學”成績超過 77 分的學生加分。 任何建議都會有所幫助。 我已經使用 if 條件來檢查標記是否高於 77,然后創建了一個列,為這些標記提供獎勵標記。 我嘗試過的是:上圖給出了那些在“math ...
[英]How to split the word "ActionAction-AdventureShooterStealth" into list of separate words?
問題:流派列包含游戲中存在的流派。 它把所有類型寫在一起,沒有任何空格或特殊字符。 首先給出游戲的主要類型,然后是其他類型。 為了更好地理解,請參閱下表。 游戲類型 A 動作喜劇冒險 B 冒險喜劇 C 旁白射擊在上表中,游戲A、B和C的主要類型分別是動作、冒險和敘事。 你的工作是提取每個游戲的主要 ...
[英]Machine learning with handling features which are suppose to have missing data
我目前正在為我的理學碩士項目工作,但我遇到了該數據集的問題。 我以前沒有機器學習方面的經驗,這是我第一次接觸。 在我的數據集中,我開始做我的 EDA(探索性數據分析),我有一個缺少數據的分類特征Province_State 。 此列有52360缺失值,百分比為5.40% 。 我想這還不錯,根據我的了 ...
[英]Can somebody please explain me this? ROUND(AVG(cast(tripduration as int64)/60),2)
當涉及到技術時,我不是很精明我剛剛開始谷歌數據分析課程,但我發現自己迷失在這個查詢中: ROUND(AVG(cast(tripduration as int64)/60),2) 寫下此查詢時我到底在問什么? 我無法真正理解課程中的講師。 我可以毫無問題地運行我的查詢,我只是不明白我到底在做什么。 ...
[英]How to create a list considering a condition in sql (azure databricks)
我正在處理 SQL 查詢(Azure Databricks 環境),其中考慮以下數據集: 客戶編號參觀過渠道購買訪問訂單 123 abc133 谷歌 0 1個 123 efg446 Facebook 0 2個 123 gij729 Instagram的 1個 3個 456 klm1 ...
[英]pandas profiling import error : not able to import pandas_profiling package
我無法從pandas.core.base導入名稱DataError 當我導入 package 時: 它顯示錯誤: ...
[英]Pandas Groupby and Compare rows to find maximum value
我有一個 dataframe一個 b c 一 6 11 一 7 12 二 8 23 二 9 14 三 10 15 三 20 25 我想groupby at column a然后highest value in column c ,以便標記最大值,即一個 b c 一 6 11 一 7 ...
[英]The edge color of the histogram is not changing even though I declared it
即使我將其聲明為黑色,我也無法更改邊框顏色。 直方圖截圖 ...
[英]Pandas Groupby Operation For Condition Based Feature Creation
基於某些 groupby + 條件難以創建特征我看起來相似的數據 ir_id 普利 pli_missing 錯誤類型 0 名稱1 1.0 不未知 1 名稱1 2.0 不鈉 2 名稱1 3.0 不鈉 3 名稱1 鈉是的未知 4 名稱2 4.0 不鈉 5 名稱2 5.0 不鈉 6 名稱2 鈉 ...
[英]How to convert from object to int in python
我試圖將此列中的值放在 1-10 的范圍內,但首先我需要得到數學方程的答案。 數據類型也是 object。 我嘗試 using.astype(int) 從 object 轉換為 int 但我需要先處理方程並獲得答案。 我怎么做? [1]: https://i.stack.imgur.com/uI ...
[英]How do I save a dataframe in the name of a variable I created earlier in the code (oldest_id and iso_data as seen in the code)
.....最后一行可能很愚蠢,但我試圖以我之前在代碼中創建的一些變量的名稱保存數據框。 ...
[英]Percentage with top 10 values in Python
在獲取 Python 中的前 10 個值和百分比時需要一些幫助。 我已經嘗試過的代碼如下: - 現在,上面最后兩行代碼給我的是:- 結果_1 但是,我期待的是:- 期待不幸的是,我無法為百分比值編寫代碼。 任何人都可以幫助我......謝謝:.! [:)] 還請找到我正在運行代碼的源數據文件。 ...
[英]Pandas fill value in another column depending upon GroupBy values
我們如何創建一個新列,即error_flag_type ,其值取決於student_id處的 groupby 數據如下所示: 學生卡主題ID 錯誤團隊 1 1 是的一個 1 2 一個 1 3 一個 1 是的一個 2 4 乙 2 5 乙 2 是的乙 3 6 乙 3 7 乙 3 8 乙 ...
[英]plotting value of groupby and value counts using pandas in python
我有一個包含兩列的數據框,年齡組和性別。 我想 plot 每個年齡組中女性和男性的百分比。 這就是我所做的 我如何將 plot 作為餅圖? 我得到了正確的百分比,但我想 plot 所有年齡段的性別百分比。 例如:18-25 歲年齡段的女性 30% 和男性 70% 等。我想在餅圖中 plot 這個信息 ...
[英]plotting percentage of occurrence in a group in data frame python
我有一個包含兩列的數據框,年齡組和性別。 我想 plot 每個年齡組中女性和男性的百分比。 這就是我所做的 我如何將 plot 作為餅圖? 我得到了正確的百分比,但我想 plot 所有年齡段的性別百分比。 例如:18-25 歲年齡段的女性 30% 和男性 70% 等。 ...
[英]How do I correctly analyze and plot my hotel booking data in R?
我是 R 的初學者,我的數據是一家擁有 3 間不同公寓的酒店及其在 2018 年至 2022 年之間的預訂數據。對於每個預訂,我都有一個到達日期和一個離開日期(已經采用日期格式),預訂的總晚數以及他們住在哪間公寓。我現在想分析和 plot 數據,以了解預訂數量隨時間的整體變化以及每個不同公寓的變化 ...