pandas rename, concat, join

1 minute read

데이터 인덱스, 열 이름 변경 rename

종종 데이터는 만족스럽지 않은 열 이름, 인덱스 이름으로 우리에게 제공됩니다. 이 경우 rename 함수를 사용하여 문제가 되는 항목의 이름을 더 나은 이름으로 변경할 수 있습니다.

df = pd.DataFrame({'key':['a','b','c'],'data':[1,2,3]})
df

rename()으로 인덱스 이름 및 열 이름을 변경할 수 있습니다. 원래 객체를 변경하지 않고 새로운 객체를 생성하므로, 원본 데이터를 바로 변경하려면 inplace=True 옵션을 줘야합니다.

df.rename(columns={'key':'key2'})

df.rename(index={0: 'first', 1: 'second'})

데이터 세트에 대한 작업을 수행 할 때 때때로 다른 DataFrame 및 Series를 결합해야합니다. Pandas에는이를위한 핵심 방법이 있는데 concat()과 join()에 대해서 알아보겠습니다.

먼저 concat()은 축을 따라 데이터를 합치는 기능을 제공합니다. 이는 서로 다른 DataFrame 또는 Series에 동일한 열이 있는 경우에 유용합니다.

df = pd.DataFrame({'key':['a','b','c'],'data':[1,2,3]})
df

df2 = pd.DataFrame({'key':['d','e','f','g'],'data':[4,5,6,7]})
df2

axis=0을 기본값으로 하여 새로운 객체를 생성합니다.

pd.concat([df,df2])

pd.concat([df,df2],axis=1)

join()은 인덱스가 공통인 다른 DataFrame 객체를 결합 할 수 있습니다.

df.join(df2,lsuffix='_df',rsuffix='_df2')

	key_df	data_df	key_df2	data_df2
0	a	1.0	d	4
1	b	2.0	e	5
2	c	3.0	f	6

lsuffix 및 rsuffix 옵션은 데이터가 df 및 df2에서 동일한 열 이름을 갖기 때문에 여기에 필요합니다.