09.a 강의 pandas

In [66]:

[  {'bikes': 20, "pants" : 30, "watches" : 35, "glasses" : 4}   ]

Out[66]:

[{'bikes': 20, 'pants': 30, 'watches': 35, 'glasses': 4}]

In [67]:

new_item = [  {'bikes': 20, "pants" : 30, "watches" : 35, "glasses" : 4}   ]

In [68]:

pd.DataFrame(data = new_item, index = ["store 3"])

Out[68]:

	bikes	pants	watches	glasses
store 3	20	30	35	4

In [69]:

new_store = pd.DataFrame(data = new_item, index = ["store 3"])

In [70]:

new_store

Out[70]:

	bikes	pants	watches	glasses
store 3	20	30	35	4

In [73]:

# df에, 새로만든 new_store를, 행으로 추가

In [76]:

df = df.append(new_store)

C:\Users\5-10\AppData\Local\Temp\ipykernel_5756\2676567635.py:1: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  df = df.append(new_store)

In [77]:

df

Out[77]:

	bikes	pants	watches	glasses	shirts	suits
store 1	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
store 3	20	30	35	4.0	NaN	NaN

In [78]:

# 데이터를 삭제하는 방법

# 행 삭제? 열삭제? => 2가지 방법으로 삭제하는것을 의미

In [79]:

# drop() 함수를 이용하고, axis 만 설정해주면 된다.

In [80]:

df

Out[80]:

	bikes	pants	watches	glasses	shirts	suits
store 1	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
store 3	20	30	35	4.0	NaN	NaN

In [81]:

# store 2 행 삭제
df.drop("store 2" , axis=0)

Out[81]:

	bikes	pants	watches	glasses	shirts	suits
store 1	20	30	35	NaN	15.0	45.0
store 3	20	30	35	4.0	NaN	NaN

In [ ]:

# df.drop("store 2") 만해도 동일한 아웃풋을 준다 
# 이유는 axis 디폴트가 0 으로 설정되어있기때문

In [ ]:

# glasses 컬럼 삭제

In [82]:

df.drop("glasses" , axis = 1)

Out[82]:

	bikes	pants	watches	shirts	suits
store 1	20	30	35	15.0	45.0
store 2	15	5	20	2.0	7.0
store 3	20	30	35	NaN	NaN

In [83]:

# pants 컬럼과 suits 컬럼을 삭제하세요

In [84]:

df.drop(["pants","suits"],axis = 1)

Out[84]:

	bikes	watches	glasses	shirts
store 1	20	35	NaN	15.0
store 2	15	20	50.0	2.0
store 3	20	35	4.0	NaN

In [85]:

df

Out[85]:

	bikes	pants	watches	glasses	shirts	suits
store 1	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
store 3	20	30	35	4.0	NaN	NaN

In [86]:

# store 3 를 last store 로 인덱스를 변경하자.

In [87]:

df.rename(index= {"store 3":"last store"} )

Out[87]:

	bikes	pants	watches	glasses	shirts	suits
store 1	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
last store	20	30	35	4.0	NaN	NaN

In [88]:

df.rename(index= {"store 3" : "last store" , "store 1" : "first store"})

Out[88]:

	bikes	pants	watches	glasses	shirts	suits
first store	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
last store	20	30	35	4.0	NaN	NaN

In [89]:

# bikes 컬럼은 hat 으로, suits 컬럼은 shoes 로 바꿔주세요

In [90]:

df.rename(columns= {"bikes" : "hat", "suits":"shoes"})

Out[90]:

	hat	pants	watches	glasses	shirts	shoes
store 1	20	30	35	NaN	15.0	45.0
store 2	15	5	20	50.0	2.0	7.0
store 3	20	30	35	4.0	NaN	NaN

In [ ]:

In [91]:

# 새로운 컬럼 name 을 만들되 
# A, B, C 로 컬럼 추가해 주세요

In [147]:

df["name"] = ["A","B","C"]

In [148]:

df

Out[148]:

	name	bikes	pants	watches	glasses	shirts	suits
0	A	20	30	35	NaN	15.0	45.0
1	B	15	5	20	50.0	2.0	7.0
2	C	20	30	35	4.0	NaN	NaN

In [139]:

# name 컬럼의 값을, 인덱스로 만들자

In [140]:

df.set_index("name",  inplace = True)   # inplace = True 는 df =  와 같은 의미

In [141]:

df.values

Out[141]:

array([[20., 30., 35., nan, 15., 45.],
       [15.,  5., 20., 50.,  2.,  7.],
       [20., 30., 35.,  4., nan, nan]])

In [142]:

df

Out[142]:

	bikes	pants	watches	glasses	shirts	suits
name
A	20	30	35	NaN	15.0	45.0
B	15	5	20	50.0	2.0	7.0
C	20	30	35	4.0	NaN	NaN

In [143]:

# 인덱스를 원래대로 초기화 시키고 싶다.(컴퓨터가 매기는 인덱스) 시키고 싶다.

In [144]:

df.reset_index(inplace= True)

In [146]:

df

Out[146]:

	name	bikes	pants	watches	glasses	shirts	suits
0	A	20	30	35	NaN	15.0	45.0
1	B	15	5	20	50.0	2.0	7.0
2	C	20	30	35	4.0	NaN	NaN

In [145]:

df.values

Out[145]:

array([['A', 20, 30, 35, nan, 15.0, 45.0],
       ['B', 15, 5, 20, 50.0, 2.0, 7.0],
       ['C', 20, 30, 35, 4.0, nan, nan]], dtype=object)

'DataScience > Pandas' 카테고리의 다른 글

Pandas NaN을 처리하는 전략 dropna(), fillna() (0)	2022.11.24
Pandas CSV파일불러오기, .describe() 통계, .info()정보 (0)	2022.11.24
Pandas .iloc[ , ], 데이터 프레임에서 컬럼 만드는 방법 (0)	2022.11.24
Pandas Dataframe, Nan의 의미, 데이터프레임 엑세스 (0)	2022.11.23
Pandas Series, 레이블과 인덱스, Operations (0)	2022.11.23

블로그안함

Pandas 행, 열 추가, 데이터 삭제 drop(), rename(), 인덱스 초기화 reset_index(inplace= True)

'DataScience > Pandas' 카테고리의 다른 글

티스토리툴바

Pandas 행, 열 추가, 데이터 삭제 drop(), rename(), 인덱스 초기화 reset_index(inplace= True)

'DataScience > Pandas' 카테고리의 다른 글

관련글

티스토리툴바