Python
-
[Python] Dafit(다핏)에서 받은 커머스 데이터 전처리데이터 분석 공부 2020. 5. 23. 12:02
몸풀기용으로 Raw Data하나 받아서 내 마음 가는대로 전처리 해보기 다음 게시물은 조금 어려운 작업도 추가해서 올려야지 ㅇㅇ 나는 개인적으로 display로 데이터 정보를 한 눈에 보는걸 선호한다. Cell마다 코드 넣고 결과보는거 나에게는 넘나 귀찮은것;; For문 써서 좀 쉽게 바꿔 보려 했는데, 특정 컬럼에 있던 이상치를 확인 안해서, 수작업으로 데이터 처리했지만, 이러한 작업 전에 결측치, 이상치를 먼저 잘 잡아내는게 중요하다. 똑바로 해야 Gui~~ 사실 처음 데이터 정리할 때는, 무언가 엄청난 노동이 들어가지는 않는다. 다만, Business Needs에 따라 데이터를 수정할 때, Which Logic을 써야할지에 대해서는 고민을 해야쥐 이제 슬슬 통계와 머신러닝, 클라우드 좀 공부하려 하..
-
Python, Warnings을 왜 활용하는가?데이터 분석 공부 2020. 4. 5. 23:45
캐글에서 코로나 바이러스 데이터 전처리를 하기 위해 코딩을 하는데, 문득 warnings에 대해 정리하고 싶어서 써본다. Jupyter notebook에서 데이터 코딩을 하다보면 버전이 올라갈 때마다 어떤 부분의 변경이 되어야 한다는 사항을 알려주는 경고 메시지(warnings message)가 뜨는 경우가 있다. 이게 빨간색인데 생각보다 거슬린다. 왠지 내가 코딩을 잘못한건가 싶기도 하고.... 그래서 해결책을 가져왔지!!! 짜잔!!! 1. warnings.filterwarnings(action = 'ignore') => 경고 메시지를 무시하고 숨긴다. 2. Warnings.filterwarnings(action = 'default') => 숨기기했던 경고 메시지를 다시 보이게 한다. 그럼 이만, By..
-
[Python, Jupyter Notebook] %matplotlib inline이 뭐니?데이터 분석 공부 2020. 3. 14. 17:36
오늘 코딩하다가 문득 데이터 시각화를 위해 무의식직으로 입력하던 %matplotlib inline의 의미가 궁금해져서 가볍게 글 쓰러 왔습니다. :) 이는 도표, 그림, 소리, 애니메이션과 같은 결과물들인 Rich Output을 나타내는 코드이다. 그냥 간단하게 얘기하면, 시각화를 하고 싶은 자료를 입력하면 쥬피터 노트북을 실행한 브라우저에 바로 그림을 나타내고 싶다면, %matplotlib inline 을 따악!!! 입력하면 됩니다. 이상 끄읕~~~!!! BAAM:)
-
Python map() 함수란 무엇인가?데이터 분석 공부 2020. 3. 5. 19:29
코로나 바이러스 데이터 처리하는 코드짜다가, map함수를 썼는데, 그냥 좀 헷갈리는 부분을 정리하려고 데이터 분석 카테고리에 첫 글을 작성한다. python map() lambda 표현식에서 조건부 표현식을 사용해봤다. - lambda 매개변수들 : 식1 if 조건식 else 식2 map은 df_patient['birth_year']의 요소들을 각각 처리하므로 lambda의 반환값도 요소로 볼 수 있다. df_patient['birth_year']의 요소들을 val변수로 지칭을 해주고, 이 값이 0보다 크면 val값을 유지해주고, 아니면 nan값을 기입해준다. 람다 표현식 안에서 조건부 표현식 if, else를 사용할 때, 콜론을 사용하지 않는다. 이것은 일반적인 조건문 표현방식과 차이점이기 때문에, 유..