본문 바로가기
반응형

분류 전체보기157

python 기술적 지표 구현해 보기(3) [min, max, quartile 구현하기] 저번 포스팅에 이어서 나머지 min, max, quartile을 구현해 봅시다. min 데이터의 최소값을 가져옵니다. min_value = None for val in values: if max_value is None : min_value = val if max_value > val : min_value = val print(f'min : {min_value}') for문을 돌면서 가장 작은 값을 가져옵니다. min_value에는 for문을 돌면서 가장 작은 값을 가져오게 됩니다. 초기값을 None을 주어서 None값일 경우 무조건 값을 설정합니다. max 데이터의 가장 큰 값을 가져옵니다. max_value = None for val in values: if max_value is None : max.. 2020. 9. 14.
python 기술적 지표 구현해 보기(2) [count, mean, std 구현하기] 저번 포스팅에 이어서 데이터 기술적 지표를 각각 구현해 보겠습니다. 이번 포스팅에는 count, mean, std를 구현해 보고 다음 포스팅에서 min, max, quartile을 구현해 볼게요 count 데이터의 총개수 이며 파이썬의 len함수를 통해 아주 쉽게 구할수 있다. count = 0 for val in values: count += 1 print(f'count : {count}') 아주 간단한 내용이지만 설명을 드리자면, count변수에 리스트 value의 개수만큼 for문을 돌면서 값을 1씩 증가시킵니다. 이러면 for문이 종료후에는 count변수에는 데이터의 총 개수가 있게 됩니다. mean 평균은 우리가 일상생활에 가장많이 쓰이는 통계이지 않을까 생각됩니다. 구현은 데이터의 총 합을 총.. 2020. 9. 14.
python 기술적 지표 구현해 보기(1) [Describe, 평균, 분산, 사분위] 기술적 지표 count, std, min, quartile 데이터를 확인하다보면 각각 피처들의 형태를 파악해야 하는 경우가 많습니다.여기서 알아 볼것은 판다스의 describe를 통해 알수 있는 count, mean, std, min, 25%, 50%, 75%, max를 알아 볼텐데요 여기선 각각 무엇을 의미하는지 간단하게 알아보고, 다음 포스팅에서 각각 파이썬으로 구하는 함수를 구현해 보겠습니다. 시각화를 할때 데이터의 가지고 있는 속성들을 기술적인 지표를 통해서 빠르게 확인이 가능합니다. 왜 pandas나 numpy를 통해서 알수 있는것들을 직접구현해 보나요? 라고 생각할수 있습니다. 하지만 직접 함수를 구현해 보면서 내부에서 어떻게 처리가 되는지 알수 있고 원론적인 내용을 파악할수 있어서 직접 구현.. 2020. 9. 14.
[데이터 시각화] seaborn scatter (산점도의 이해) Scatter plot scatter (산점도)는 수치와 수치를 비교할때 사용한다. 즉, float, float를 비교한다 생각하면 좋을거 같다. 초보자가 가끔하는 어뚱한짓은 x축이나 y축을 int, 카테고리 컬럼등등을 써서 비교하는 경우가 있는데 이는 아마도 이상한 모양이 나올 확률이 높다. 다시 말해서 scatter plot은 두변수가 수치형일경우 적합한 차트라고 이해하면 좋을거 같다. 하지만 scatter의 차트 기능을 통해 수치형을 비교후 범주형(카테고리)데이터를 비교분석 할 수 있다. 아래에서 편의상 scatterplot과 relplot을 혼횽했지만 둘다 scatter를 표현하는 차트라고 이해하면 된다. relplot은 scatter기능에서 추가로 카테고리별 차트기능을 그려주는데 이는 이번 실습.. 2020. 9. 12.
반응형