[問題] dataframe重複的row計數
各位版友好,想請教關於dataframe的問題
假設我現在有一份表格(df)如下
A B C D
a 1 2 3
b 1 2 3
c 4 5 6
a 1 2 3
a 1 2 3
c 4 5 6
請問有方法計算重複的row分別出現幾次嗎?
目前知道 df[df.duplicated()].count() 可以得到所有重複出現的row的總次數
還有 df.drop_duplicates() 可以刪除重複的資料
現在想新增一個column放重複次數,再將重複的部分刪掉
希望能做成
A B C D count
a 1 2 3 3
b 1 2 3 1
c 4 5 6 2
但找不太到怎麼先把重複幾次記下來再刪掉
希望版友指點,先感謝各位!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.177.33 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1595757331.A.474.html
推
07/26 18:14,
4年前
, 1F
07/26 18:14, 1F
→
07/26 18:14,
4年前
, 2F
07/26 18:14, 2F
推
07/26 18:36,
4年前
, 3F
07/26 18:36, 3F
→
07/27 02:46,
4年前
, 4F
07/27 02:46, 4F
→
07/27 09:30,
4年前
, 5F
07/27 09:30, 5F