pandas,groupby
在Pandas中,社交領域將用戶根據畫像(性別、年齡)進行細分,研究用戶的使用情況和偏好等主要運用groupby完成。
Groupby的基本原理:
在pandas中,實現分組操作的代碼很簡單,僅需一行代碼,在這裏,將上面的數據集按照company字段進行劃分:
In [5]: group = data.groupby("company")
將上述代碼輸入ipython後,會得到一個DataFrameGroupBy對象
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那這個生成的DataFrameGroupBy是啥呢?對data進行了groupby後發生了什麼?ipython所返回的結果是其內存地址,並不利於直觀地理解,爲了看看group內部究竟是什麼,這裏把group轉換成list的形式來看:
In [8]: list(group)
Out[8]:
[('A', company salary age
3 A 20 22
6 A 23 33),
('B', company salary age
4 B 10 17
5 B 21 40
8 B 8 30),
('C', company salary age
0 C 43 35
1 C 17 25
2 C 8 30
7 C 49 19)]
轉換成列表的形式後,可以看到,列表由三個元組組成,每個元組中,第一個元素是組別(這裏是按照company進行分組,所以最後分爲了A,B,C),第二個元素的是對應組別下的DataFrame,整個過程可以圖解如下:
總結來說,groupby的過程就是將原有的DataFrame按照groupby的字段(這裏是company),劃分爲若干個分組DataFrame,被分爲多少個組就有多少個分組DataFrame。所以說,在groupby之後的一系列操作(如agg、apply等),均是基於子DataFrame的操作。
-
富有哲理的簡短句子
1、爲人處事要細心,但不好留意眼。2、看盡所有的人生感悟,我們都沒有悟透這人生。3、不管你在世界的哪個地方,當你的太太要生孩子時,一定要在她身邊。4、人生就像一場賭局,不可能把把都贏,只要籌碼在自己手上,就永遠都會有希望。5、沒有不可治癒的傷痛,沒有不能結束的...
-
2022虎年新年祝福押韻
願你的一切煩惱被二極管截止,快樂被三極管放大,生活裏的磕磕絆絆被穩壓管整流,一切幸福被愛的芯片集成,被生活的電容存儲,無阻尼振盪伴你一生!祝新年快樂!當你看見這信息時,幸運已降臨到你頭上,財神已進了你家門,福氣滾滾奔向你,祝福你新春快樂!春節到,福來報,開開心心鬧...
-
夏季高溫天氣的防暑降溫措施,有什麼防暑降溫措施
1、及時飲水,根據氣溫的高低,一般的人每天喝1.5到2升的水.高溫作業人員每天喝3到5升的水,同時多吃水果,新鮮蔬菜,適當的這攝入鹽分,補充因爲大量出汗導致的電解質流失。另外,夏季人體容易缺鉀,使人感到疲倦乏力,含鉀類茶水是極好的消暑飲品。2、及時散熱多洗澡或多用溼...
-
枇杷相關介紹
1、枇杷的果皮能吃,並且很多營養物質都含在果皮中,因此,若是脾胃功能較佳,在吃枇杷時只需要將外皮洗乾淨,果皮可一起食用,營養補充更徹底;另外,枇杷果在做止咳藥物使用時也是不去皮的,果皮中的有效成分比果肉中高很多,洗淨後直接入藥即可。2、枇杷的外皮上長有一層絨毛,有...
相關文章
- 百度雲下載完成後baiduyun,downloading仍然存在怎麼辦
- WIN64位下裝PS出現下載adobe support advisor
- rapid storage technology是什麼意思
- win10藍屏終止代碼page fault in nonpaged area
- SolidWorks無法裝入GdtAnalysisSupport,dll文件
- autodesk application manager是什麼軟件
- 解決 PS adobe application manager丟失或損壞
- order by和group by的區別
- dubbo與springcloud的區別
- operatingsystemnotfound什麼意思