pandas,groupby
在Pandas中,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等主要运用groupby完成。
Groupby的基本原理:
在pandas中,实现分组操作的代码很简单,仅需一行代码,在这里,将上面的数据集按照company字段进行划分:
In [5]: group = data.groupby("company")
将上述代码输入ipython后,会得到一个DataFrameGroupBy对象
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那这个生成的DataFrameGroupBy是啥呢?对data进行了groupby后发生了什么?ipython所返回的结果是其内存地址,并不利于直观地理解,为了看看group内部究竟是什么,这里把group转换成list的形式来看:
In [8]: list(group)
Out[8]:
[('A', company salary age
3 A 20 22
6 A 23 33),
('B', company salary age
4 B 10 17
5 B 21 40
8 B 8 30),
('C', company salary age
0 C 43 35
1 C 17 25
2 C 8 30
7 C 49 19)]
转换成列表的形式后,可以看到,列表由三个元组组成,每个元组中,第一个元素是组别(这里是按照company进行分组,所以最后分为了A,B,C),第二个元素的是对应组别下的DataFrame,整个过程可以图解如下:
总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame。所以说,在groupby之后的一系列操作(如agg、apply等),均是基于子DataFrame的操作。
-
那些让人心酸的句子
1、你,有没有一刻心疼过我的执着。2、坚强是泪水中的微笑,是爱和痛的花朵。3、有谁可以理解相爱却不能在一起的痛苦。4、幸福可是是镜花水月,爱情可是是徒有虚名。5、那些过去存在于我的记忆。终归我是爱你的。6、坚强地面对一切,就能使自己的生命如流星般明亮。7...
-
qq说说唯美经典的一句话语录
一、从现在开始,聪明一点,不要问别人想不想你,爱不爱你?若是要想你或者爱你自然会对你说,但是从你的嘴里说出来,别人会很骄傲和不在乎你。再也不要太在意一些人,太在乎一些事,顺其自然以最佳心态面对,因为这个世界就是这样:往往在最在乎的事物面前,我们最没有价值。二、生...
-
告别迎接2022年唯美语录
1、开始新的一年,收拾行囊,重新开始,无论晴天还是阴天,都要给自己一个美丽的微笑。下面是小编给大家整理的关于2021再见2022你好经典文案,欢迎大家来阅读。2、挑战无处不在,自己才是真正的敌人。2021再见;2022你好!3、无所有就是拼搏的理由。再见了,2021年!你好,2022年...
-
土豆脆脆的算是熟了吗,脆脆的土豆熟没熟
1、土豆脆脆的不一定是没熟,也可能是在炒制过程中将它炒的比较脆而已,因为一些人在吃土豆的时候会更喜欢爽脆的口感。2、要是想吃软糯一点的,我们可以在炒制土豆的时候在锅里加些水,然后盖上盖子焖一段时间再炒。...
相关文章
- autodesk application manager是什么软件
- rapid storage technology是什么意思
- 百度云下载完成后baiduyun,downloading仍然存在怎么办
- SolidWorks无法装入GdtAnalysisSupport,dll文件
- win10蓝屏终止代码page fault in nonpaged area
- dubbo与springcloud的区别
- 解决 PS adobe application manager丢失或损坏
- WIN64位下装PS出现下载adobe support advisor
- operatingsystemnotfound什么意思
- order by和group by的区别