project/data science(3)
-
pandas 기초2
기본 import numpy as np import pandas as pd 조건 검색 -masking & query 방법 1. dataFrame 있으면 단순히 dataFrame 변수명에 조건문 넣듯이 사용 가능 df = pd.DataFrame(np.random.rand(3, 2), columns=["A", "B"]) df[“A”] false, true 형식 말고 차트로 나옴 df.query("A 0.3") 결과 : 함수 사용 -apply() df["column_name"].apply(func) groupby df.groupby('column_name') pivot_table ..
2020.10.20 -
pandas 기본
import pandas as pd Series 배열이자 파이썬의 dictionary 같은 부분 : 배열식인데 index 있음. data = pd.Series([1,2,3,4] , index = ['a', 'b', 'c', 'd']) a : 1 b : 2 c : 3 d : 4 딕셔너리로 series 만들 수 있음! dict = { 'seoul' : 4325, 'sejong' : 6542, } ser = pd.Series(dict) key => index value => data DataFrame : 여러 개의 Series dataframe = pd.DataFrame({ 'values1':values,#values = pd.Series({'seoul': 2, 'sejong' : 4}) 'values2' :..
2020.10.13 -
numpy 이용해 간단한 연산
기본 설정 = 라이브러리 호출 import numpy as np 배열 생성 arr = np.arange(6) #[0,1,2,3,4,5] matrix 만들기 arr = np.array(6) arr2 = arr.reshape((2,3)) #[[0,1,2] #[3,4,5]] 이어 붙이기 matrix = np.array([[0,1,2,3], [4,5,6,7]]) m=np.concatenate([matrix,matrix],axis=0) ''' [[0 1 2 3] [4 5 6 7] [0 1 2 3] [4 5 6 7]] ''' 브로드캐스팅 연산 (행렬에선 계산할 떄 사이즈 맞아야되는데 얘는 ''' A = np.arange(6).reshape(3,2) B = np.arange(3).reshape(3,1) A+B '''..
2020.10.13