pandas 기초2

2020. 10. 20. 12:00project/data science

기본

import numpy as np
import pandas as pd

 

조건 검색

-masking & query

 

방법 1. dataFrame 있으면 단순히 dataFrame 변수명에 조건문 넣듯이 사용 가능

 

df = pd.DataFrame(np.random.rand(3, 2), columns=["A", "B"])
df[“A”] < 0.5

 

결과 :

df(df[“A”] < 0.5)

로 감싸주면 차트형식

 

 

방법2 . query 사용 -> false, true 형식 말고 차트로 나옴 

df.query("A < 0.5 and B > 0.3")

결과 :

 

 

함수 사용

-apply()

 

df["column_name"].apply(func)

 

groupby

df.groupby('column_name')

 

 

pivot_table

: 조건으로 새로운 table 생성

 

index :인덱스 값

Column:인덱스 

Value: 분석할 데이터

 

  sex class grade
1 female 1 4.5
2 male 1 4.3
3 female 2 3.6
4 male 2 4.3
5 female 1 3.9
pivot_table(index="sex",column="class",values="grade",aggfunc = np.mean)

 

결과 :

class 1 2
sex    
female 4.1 3.6
male 4.3 4.3

'project > data science' 카테고리의 다른 글

pandas 기본  (0) 2020.10.13
numpy 이용해 간단한 연산  (0) 2020.10.13