groupBy, pivot_table

groupby

df.groupby(["성별코드"]).mean()

df.groupby(["성별코드"]).count()

df.groupby(["성별코드"])["가입자일련번호"].count()

df.groupby(["성별코드", "음주여부"])["가입자일련번호"].count()
df.groupby(["성별코드", "음주여부"])["감마지티피"].mean()
df.groupby(["성별코드", "음주여부"])["감마지티피"].describe()

df.groupby(["성별코드", "음주여부"])["감마지티피"].agg(["count", "mean", "median"])

pivot_table

df.pivot_table(index="성별코드", values="가입자일련번호", aggfunc="count")

df.pivot_table(index="음주여부", values="가입자일련번호", aggfunc="count")

Untitled

pivot_table의 연산 속도가 groupby보다 빠르다.

#기본적으로 평균값을 구한다.
pd.pivot_table(df, index="음주여부", values="감마지티피")

pd.pivot_table(df, index="음주여부", values="감마지티피", aggfunc=["mean", "median"])

pd.pivot_table(df, index="음주여부", values="감마지티피", aggfunc="describe")

pd.pivot_table(df, index=["음주여부", "성별코드"], values="감마지티피", aggfunc="describe")

Untitled