소개
Pandas 라이브러리는 Python을 사용한 데이터 분석에 매우 유용하며 데이터 처리 및 분석에 가장 많이 사용되는 도구 중 하나입니다.
이 블로그에서는 Pandas를 사용하여 DataFrame을 만들고 다양한 데이터 분석 작업을 수행하는 방법을 배웁니다.
데이터 프레임
Pandas의 핵심 데이터 구조 중 하나인 DataFrame은 2차원 테이블과 같은 테이블이며 데이터를 행과 열로 구성합니다.
각 열은 서로 다른 유형의 데이터(숫자, 문자열, 부울 등)를 포함할 수 있습니다.
pandas에서 DataFrame은 시리즈로 구성된 사전으로 구성할 수 있습니다.
또는 CSV 파일 및 Excel 파일과 같은 다른 데이터 소스에서 읽습니다.
데이터 프레임 다루기
다음은 DataFrame을 만들고 pandas 라이브러리를 사용하여 다양한 작업을 수행하는 방법에 대한 예입니다.
# 판다스 라이브러리 불러오기
import pandas as pd
# 데이터프레임 생성하기
data = {'name': ('John', 'Bob', 'Alice', 'Charlie'),
'age': (25, 30, 35, 40),
'city': ('New York', 'Paris', 'London', 'Tokyo')}
df = pd.DataFrame(data)
# 특정 열 선택하기
print(df('name'))
# 조건에 따라 행 필터링하기
print(df(df('age') > 30))
# 열간의 상관관계 계산하기
print(df.corr())
# 데이터 시각화하기
import matplotlib.pyplot as plt
df.plot(kind='bar', x='name', y='age')
plt.show()
졸업 증서
Pandas는 데이터 처리 및 분석을 위한 강력한 기능을 제공합니다.
판다의 다양한 기능을 알아보고 데이터 분석에 활용해보세요!