[問題] dataframe重複的row計數

看板Python作者 (y.l)時間4年前 (2020/07/26 17:55), 編輯推噓2(203)
留言5則, 4人參與, 4年前最新討論串1/1
各位版友好,想請教關於dataframe的問題 假設我現在有一份表格(df)如下 A B C D a 1 2 3 b 1 2 3 c 4 5 6 a 1 2 3 a 1 2 3 c 4 5 6 請問有方法計算重複的row分別出現幾次嗎? 目前知道 df[df.duplicated()].count() 可以得到所有重複出現的row的總次數 還有 df.drop_duplicates() 可以刪除重複的資料 現在想新增一個column放重複次數,再將重複的部分刪掉 希望能做成 A B C D count a 1 2 3 3 b 1 2 3 1 c 4 5 6 2 但找不太到怎麼先把重複幾次記下來再刪掉 希望版友指點,先感謝各位! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.177.33 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1595757331.A.474.html

07/26 18:14, 4年前 , 1F
df.groupby(list(df.columns)).size().reset_index(name=
07/26 18:14, 1F

07/26 18:14, 4年前 , 2F
='count')
07/26 18:14, 2F

07/26 18:36, 4年前 , 3F
df.T.values_counts()
07/26 18:36, 3F

07/27 02:46, 4年前 , 4F
推一樓大 二樓的看起來會報錯?
07/27 02:46, 4F

07/27 09:30, 4年前 , 5F
用m大的方法成功了,謝謝大家回覆!
07/27 09:30, 5F
文章代碼(AID): #1V7LCJHq (Python)