데이터 분석 공부
-
Python, Warnings을 왜 활용하는가?데이터 분석 공부 2020. 4. 5. 23:45
캐글에서 코로나 바이러스 데이터 전처리를 하기 위해 코딩을 하는데, 문득 warnings에 대해 정리하고 싶어서 써본다. Jupyter notebook에서 데이터 코딩을 하다보면 버전이 올라갈 때마다 어떤 부분의 변경이 되어야 한다는 사항을 알려주는 경고 메시지(warnings message)가 뜨는 경우가 있다. 이게 빨간색인데 생각보다 거슬린다. 왠지 내가 코딩을 잘못한건가 싶기도 하고.... 그래서 해결책을 가져왔지!!! 짜잔!!! 1. warnings.filterwarnings(action = 'ignore') => 경고 메시지를 무시하고 숨긴다. 2. Warnings.filterwarnings(action = 'default') => 숨기기했던 경고 메시지를 다시 보이게 한다. 그럼 이만, By..
-
<Kaggle참고> 코로나 바이러스 분석 및 시각화(2) datetime 활용하기 Python, 파이썬데이터 분석 공부 2020. 4. 4. 17:10
코로나 바이러스 시계열 분석하려고 코딩 짜다가 문득 Datetime패키지에 대해 정리를 해볼까 하고 남겨본다잉 datetime패키지에는 크게 다음과 같은 패키지를 제공한다. datetime: 날짜와 시간을 함께 저장하는 클래스 date: 날짜만 저장하는 클래스 time: 시간만 저장하는 클래스 timedelta: 시간 구간 정보를 저장하는 클래스 좀 더 자세히 살펴보자 datetime.datetime클래스 => 패키지 이름과 클래스 이름이 동일하기 때문에 조심해야 한다. 다른 클래스와 달리 클래스 이름이 대문자로 시작하지 않는다. => 객체를 생성하지 않고, 바로 클래스에서 사용할 수 있는 클래스 메서드라는 것을 제공한다. 예시: datetime.datetime.now() now() 클래스 메서드는 컴퓨..
-
<Kaggle참고> 코로나 바이러스 분석 및 시각화(1)데이터 분석 공부 2020. 4. 1. 00:56
코딩을 하기 앞서 https://www.kaggle.com/therealcyberlord/coronavirus-covid-19-visualization-prediction에서 사용한 패키지에 대해서 정리를 하는 것이 필요할 듯 하다. 1. import numpy as np NumPy("넘파이"라 읽는다)는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리 할 수 있도록 지원하는 파이썬의 라이브러리이다. NumPy는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공한다.(출처: 위키백과) => 간단하게 설명하면, 데이터 분석을 포함하여 수학과 과학연산을 위한 파이썬 기본 패키지이다. 왜 사용을 하는가? => 첫째, 효율적인 N-차원 배열 객체를 사용할 수 있다. 이를 통해, 메모리를 효..
-
[Python, Jupyter Notebook] %matplotlib inline이 뭐니?데이터 분석 공부 2020. 3. 14. 17:36
오늘 코딩하다가 문득 데이터 시각화를 위해 무의식직으로 입력하던 %matplotlib inline의 의미가 궁금해져서 가볍게 글 쓰러 왔습니다. :) 이는 도표, 그림, 소리, 애니메이션과 같은 결과물들인 Rich Output을 나타내는 코드이다. 그냥 간단하게 얘기하면, 시각화를 하고 싶은 자료를 입력하면 쥬피터 노트북을 실행한 브라우저에 바로 그림을 나타내고 싶다면, %matplotlib inline 을 따악!!! 입력하면 됩니다. 이상 끄읕~~~!!! BAAM:)
-
Python map() 함수란 무엇인가?데이터 분석 공부 2020. 3. 5. 19:29
코로나 바이러스 데이터 처리하는 코드짜다가, map함수를 썼는데, 그냥 좀 헷갈리는 부분을 정리하려고 데이터 분석 카테고리에 첫 글을 작성한다. python map() lambda 표현식에서 조건부 표현식을 사용해봤다. - lambda 매개변수들 : 식1 if 조건식 else 식2 map은 df_patient['birth_year']의 요소들을 각각 처리하므로 lambda의 반환값도 요소로 볼 수 있다. df_patient['birth_year']의 요소들을 val변수로 지칭을 해주고, 이 값이 0보다 크면 val값을 유지해주고, 아니면 nan값을 기입해준다. 람다 표현식 안에서 조건부 표현식 if, else를 사용할 때, 콜론을 사용하지 않는다. 이것은 일반적인 조건문 표현방식과 차이점이기 때문에, 유..
-
AI의 발전 과정(1)데이터 분석 공부 2019. 12. 26. 18:05
AI는 기계로 표현되는 개체가 스스로 판단을 내릴 수 있는 지능이고, 그 수준의 높낮이에 상관없이 스스로 판단을 내릴 수 있다는 것이다. AI의 태동과 1차 고비 1950년, 영국의 천재 수학자인 앨런 튜링이 '계산 기계와 지성'이라는 논문을 통해 기계가 독자적인 생각을 할 수 있는지에 대한 질문을 던졌다. 그리고 실제로 기계의 사고 능력을 측정하기 위해 '튜링 테스트'를 제안했다. 이후 AI를 통한 체크, 문장 해독 등 여러 가지 사안에 대한 해결책들을 찾아내며 AI의 활용성에 대한 관심이 높아졌다. 단점 : 프로그래밍한 지시에만 수행을 했고, 그만큼 개발이 어렵고 적용 범위가 한정적이었다. 머신러닝을 통한 AI의 진화 머신러닝에 대한 연구 덕분에 사람들이 직접 프로그래밍적 지시를 하기보다는 기계가 데..