넘파이&판다스 27

[Pandas] 카테고리컬 데이터(Categorical Data)인지 확인해보자, describe()

카테고리컬 데이터(Categorical Data)인지 확인해보자¶ 카테고리컬 데이터인지 확인해보는 방법은 간단하다. 분석을 원하는 행에 describe 함수를 써보자! 카테고리컬 데이터는 그룹으로 나눌 수 있는 데이터 유형이기에 describe의 결과 중 count와 unique를 보면 된다. 예시에서는 알러지의 종류가 카테고리컬 데이터인지 확인해 보겠다. 예시를 보자! In [1]: import pandas as pd In [4]: df = pd.read_csv('Food_allergy.csv', index_col=0) In [6]: df Out[6]: name grade allergy 0 a 1 egg 1 b 1 egg 2 c 1 avocado 3 d 1 fish 4 e 2 egg 5 ..

넘파이&판다스 2021.11.26

[Pandas] 판다스 데이터프레임 NaN이 든 행과 열 삭제하기, dropna

NaN이 든 행이나 열을 삭제해보자!¶ 함수는 dropna 를 사용하면 되고 파라미터로 축을 입력할 수 있다. In [1]: import pandas as pd In [4]: df Out[4]: bikes pants watches shirts shoes suits glasses stre 1 20 30 35 15.0 8 45.0 NaN store 2 15 5 10 2.0 5 7.0 50.0 store 3 20 30 35 NaN 10 NaN 4.0 In [5]: df.dropna() # 디폴트 삭제시 행으로 삭제 Out[5]: bikes pants watches shirts shoes suits glasses store 2 15 5 10 2.0 5 7.0 50.0 In [6]: df.dropna(axis =..

넘파이&판다스 2021.11.21

[Pandas] 판다스 데이터프레임 NaN 데이터 확인하기, isna, notna

NaN 데이터가 있는지 확인하는 함수 isna, notna¶ isna 는 NaN이 있는가? 묻는것이고, notna는 NaN이 없지? 라고 묻는것이다. 당연하게 대답을 맞다 아니다로 하게되기에 True와 False로 리턴된다. In [1]: import pandas as pd In [4]: df Out[4]: bikes pants watches shirts shoes suits glasses stre 1 20 30 35 15.0 8 45.0 NaN store 2 15 5 10 2.0 5 7.0 50.0 store 3 20 30 35 NaN 10 NaN 4.0 In [5]: df.isna() # 비어있으면 True Out[5]: bikes pants watches shirts shoes suits glass..

넘파이&판다스 2021.11.21

[Pandas] 판다스 데이터프레임, 컬럼을 인덱스로 만들고, 다시 컬럼으로 되돌리기! set_index, reset_index()

컬럼을 인덱스로 만들어보자! set_index¶ In [1]: import pandas as pd In [13]: df Out[13]: bikes pants watches glasses shirts suits name store1 20 30 35 NaN 15.0 45.0 A store2 15 5 10 50.0 2.0 7.0 B store3 20 30 35 4.0 NaN NaN C In [14]: df = df.set_index('name') # set_index의 괄호안에 인덱스로 만들고싶은 컬럼이름을 적어주면 된다. In [15]: df Out[15]: bikes pants watches glasses shirts suits name A 20 30 35 NaN 15.0 45.0 B 15 ..

넘파이&판다스 2021.11.21

[Pandas] 판다스 데이터프레임, 인덱스와 컬럼명 바꾸기 rename

데이터프레임에서 인덱스와 컬럼이름을 바꾸어보자, rename¶ 인덱스와 컬럼이름을 바꾸려면 rename 함수에 딕셔너리 형태로 바꾸고싶은 값을 넣어주면 된다. 자세한것은 아래 예제를 보자 In [1]: import pandas as pd In [8]: df Out[8]: bikes pants watches glasses store1 20 30 35 NaN store2 15 5 10 50.0 store3 20 30 35 4.0 In [9]: df.rename(index= {'store3' : 'last store'}) Out[9]: bikes pants watches glasses store1 20 30 35 NaN store2 15 5 10 50.0 last store 20 ..

넘파이&판다스 2021.11.21

[Pandas] 판다스 데이터프레임, 행과 열 삭제하기

데이터프레임의 행 삭제하기¶ 함수 drop을 사용하면 행과 열을 삭제할 수 있다. In [1]: import pandas as pd In [2]: items = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] In [3]: df = pd.DataFrame(data = items, index = ['store1', 'store2']) In [4]: df Out[4]: bikes pants watches glasses store1 20 30 35 NaN..

넘파이&판다스 2021.11.21

[Pandas] 판다스 데이터프레임, 행과 열 추가하기

데이터프레임에서 열(컬럼)을 추가해보자!¶ 새로운 컬럼을 만드는 방법은 간단하다. 데이터프레임[새로운 컬럼이름] = [새로운 컬럼의 값] 이다. In [1]: import pandas as pd In [3]: items = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] In [4]: df = pd.DataFrame(data = items, index = ['store1', 'store2']) In [5]: df Out[5]: bikes pants ..

넘파이&판다스 2021.11.21

[Pandas] 데이터프레임 값 변경하기

데이터 프레임 값을 변경해보자¶ 등호를 기준으로 왼쪽에는 바꾸고싶은 값의 데이터 억세싱을 오른쪽에는 바꾸고싶은 값을 넣어주면 된다. In [1]: import pandas as pd In [2]: items = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] In [3]: df = pd.DataFrame(data = items, index = ['store1', 'store2']) In [4]: df Out[4]: bikes pants watches..

넘파이&판다스 2021.11.21

[Pandas] 데이터 프레임에 Data accessing하기, loc, iloc, [대괄호]

데이터프레임에 Data accessing 해보자!¶ 판다스 데이터 프레임에서, 데이터를 억세스하는 방법에는 3가지가 있다. 하나씩 해보자 컬럼의 값을 가져와보자. DataFrame[대괄호]¶ In [1]: import pandas as pd In [2]: items = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] In [4]: df = pd.DataFrame(data = items, index = ['store1', 'store2']) In [5..

넘파이&판다스 2021.11.21