pandas,groupby
在Pandas中,社交領域將用户根據畫像(性別、年齡)進行細分,研究用户的使用情況和偏好等主要運用groupby完成。
Groupby的基本原理:
在pandas中,實現分組操作的代碼很簡單,僅需一行代碼,在這裏,將上面的數據集按照company字段進行劃分:
In [5]: group = data.groupby("company")
將上述代碼輸入ipython後,會得到一個DataFrameGroupBy對象
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那這個生成的DataFrameGroupBy是啥呢?對data進行了groupby後發生了什麼?ipython所返回的結果是其內存地址,並不利於直觀地理解,為了看看group內部究竟是什麼,這裏把group轉換成list的形式來看:
In [8]: list(group)
Out[8]:
[('A', company salary age
3 A 20 22
6 A 23 33),
('B', company salary age
4 B 10 17
5 B 21 40
8 B 8 30),
('C', company salary age
0 C 43 35
1 C 17 25
2 C 8 30
7 C 49 19)]
轉換成列表的形式後,可以看到,列表由三個元組組成,每個元組中,第一個元素是組別(這裏是按照company進行分組,所以最後分為了A,B,C),第二個元素的是對應組別下的DataFrame,整個過程可以圖解如下:
總結來説,groupby的過程就是將原有的DataFrame按照groupby的字段(這裏是company),劃分為若干個分組DataFrame,被分為多少個組就有多少個分組DataFrame。所以説,在groupby之後的一系列操作(如agg、apply等),均是基於子DataFrame的操作。
-
塞鼻子最有效的方法,塞鼻子最有效的方法是什麼
1、可以先喝杯白開水,這樣能使全身血液循環加快,從而讓鼻孔暢通,達到緩解鼻塞的效果。或者把熱毛巾放在熱水裏浸濕,擰乾之後直接敷在鼻子上。2、用熱水泡腳也是可以讓鼻子暢通的,而且還能夠起到緩解疲勞的作用。3、可以先喝杯白開水,這樣能使全身血液循環加快,從而讓...
-
好聽的英文潮名有什麼
1、Valentina範倫汀娜,健康者,強壯者。2、Valerie瓦勒莉,強壯的人;勇敢的人。3、Vanessa瓦妮莎,希臘蝴蝶。4、Venus維納斯,愛與美的女神。5、Vera維拉,誠實,忠誠。6、Verna維娜,春天的美女;賦於美麗的外表。7、Veromca維隆卡,勝利者。8、Veronica維拉妮卡,帶來勝利訊息者。...
-
普洱茶磚沖泡方法介紹
1、撬茶:用茶刀從各種普洱緊壓茶(餅、磚、沱等)撬下適量(5-10克)普洱茶。2、投茶:將撬下來的普洱茶放入蓋碗中。3、洗茶:將沸水衝入蓋碗中泡茶,這稱為第一泡,一般情況下第一泡是不喝的,用來洗去茶中灰塵以及讓茶葉遇水溶開,以便後幾泡能有飽滿地道的茶味。4、倒掉第一泡:第...
-
説説句子大全心情短語
1、故事的開頭總是相伴到老,故事的結局總是各自安好。2、時間,會沉澱最真的情感;風雨,會考驗最暖的陪伴。3、人生偉業的創建,不在能知,乃在能行。4、説再也不要去想你的人是我,夜裏在被窩哭的也是我。5、每天醒來,敲醒自己的不是鐘聲,而是夢想。6、人生就是一場盛大的遇...
相關文章
- order by和group by的區別
- dubbo與springcloud的區別
- 解決 PS adobe application manager丟失或損壞
- SolidWorks無法裝入GdtAnalysisSupport,dll文件
- operatingsystemnotfound什麼意思
- rapid storage technology是什麼意思
- 百度雲下載完成後baiduyun,downloading仍然存在怎麼辦
- autodesk application manager是什麼軟件
- WIN64位下裝PS出現下載adobe support advisor
- win10藍屏終止代碼page fault in nonpaged area