본문 바로가기
반응형

pandas4

[seaborn, pandas] boxplot에 대한 관찰 어떤 데이터를 어떻게 표현해주는게 좋을까? 관찰 - boxplot 이번엔 boxplot에 대해서 관찰해보겠습니다. seaborn과 판다스에는 데이터를 boxplot으로 시각화하는 함수가 내장되어 있다. 그럼 그리는건 좋은데 무엇을 boxplot으로 그려야할지 난감할 때가 많다. 무조건 먼저 그려버리고 데이터의 특성이 잘 나타내는지 지켜보는것이 시각화의 방법일까? 머릿속으로 먼저 데이터를 파악한 후에 머릿속에 그려지는 차트를 표현하는것이 가장 좋은 방법일거 같다. 그럼 boxplot에 대해서 어떤 특성을 가지고 있는지 확인할 필요가 있어 보인다. 그럼 간단하게 np.array를 만들어 boxplot을 그려봅시다 values = np.array([1,3,4,5,6,8,10,14,16,20]) values s.. 2020. 9. 15.
pandas 시각화 - 결측치를 시각화 해보자 [seaborn, missingno] 결측치는 머신러닝을할때나 딥러닝을 할 때 가장 고민스러운 결측치 즉, 비어있는값을 어떤 값으로 채울지 입니다. 보통 경험상 결측치를 채우는 방법은 아래 방법으로 많이 합니다. 숫자형일경우, mean, std, midian이런 수치로 많이 채우게 됩니다. 문자열같은 경우 가장많이 나오는 건수의 문자열로 채워주기도 합니다. 하지만 데이터마다 채워야하는 정보는 다를수 있기 때문에 본인이 판단해서 채워야 합니다. 그럼 우리는 결측치가 데이터셋에 얼만큼있는지 판별하기 위한 시각화 방법을 알려드리겠습니다. 크게 2가지 방법을 알려드리겠습니다. 기본 pandas및 seaborn으로 시각화 missingno를 이용한 시각화 (아주 간편) 그럼 먼저 pandas 및 seaborn을 이용한 시각화를 해보겠습니다. 필요한 .. 2020. 9. 15.
python 기술적 지표 구현해 보기(3) [min, max, quartile 구현하기] 저번 포스팅에 이어서 나머지 min, max, quartile을 구현해 봅시다. min 데이터의 최소값을 가져옵니다. min_value = None for val in values: if max_value is None : min_value = val if max_value > val : min_value = val print(f'min : {min_value}') for문을 돌면서 가장 작은 값을 가져옵니다. min_value에는 for문을 돌면서 가장 작은 값을 가져오게 됩니다. 초기값을 None을 주어서 None값일 경우 무조건 값을 설정합니다. max 데이터의 가장 큰 값을 가져옵니다. max_value = None for val in values: if max_value is None : max.. 2020. 9. 14.
python timezone 변경 파이썬, 판다스 datetime64객체의 timezone을 변경해보자 from datetime import datetime from pytz import timezone from_zone = tz.gettz('UTC') to_zone = tz.gettz('Asia/Seoul') data['datetime'] = data['datetime'].apply(lambda x: x.replace(tzinfo=from_zone).astimezone(to_zone)) 2020. 9. 10.
반응형