데이터분석
-
생존분석(카플란 마이어, Kaplan-Meier Estimation)데이터 분석 공부 2021. 1. 16. 10:35
생존분석이란? Censoring을 고려하여 Time to Event에 대해 분석을 하는 것을 말한다. 사건의 발생 확률을 알아보는 통계 분석 및 예측 기법 중 하나이다. 생존분석에 존재하는 3가지 주요 개념 1. 사건(Event): 분야에 따라 사건의 정의가 달라지며, 사망, 이탈 등이 사건에 해당한다. 2. 시간(Time): 대상을 관찰하기 시작한 시점으로부터 경과한 시간을 의미한다. 3. 중도절단(Censored): 생존분석에서 손실된 데이터를 처리하기 위해 도입된 개념이고 Right Censored와 Left Censored로 구분이 된다. Right Censored: 특정 사건이 발생한 시점이 특정 시기(서비스 프로모션이 끝난 시기)이후인 경우 Left Censored: 특정 사건이 발생한 시점이..
-
Simple Linear Regression에 대한 탐구데이터 분석 공부 2020. 9. 10. 01:17
머신러닝에 대한 기본적인 모델들을 공부할 때, 기본적인 것들 중에서 Simple Linear Regression을 마주할 수 있다. 그래서 오늘은 Regression, 즉 회귀가 무엇인지에 대한 글을 쓰려고 한다. 1. Regression이 뭐야? 통계학적으로는 ouput variable과 input variable간의 관계를 측정하는 기준으로써 정의됐다. 그리고, Linear Regression, 선형 회귀는 이전과 이후 사건의 선형 관계를 알고자 하는 방법이다.input 변수들의 갯수에 따라서 선형 회귀는 Simple Linear Regression(1개의 input), Multiple linear regression(다수의 input)으로 나뉜다. 2. 표현식 input 변수를 보통 x, outpu..
-
알고리즘_코딩도장_비슷한 단어 찾아내기데이터 분석 공부 2020. 8. 11. 01:08
문제 아래와 같은 결과를 출력하는 function을 구현하라! bool OneEditApart(string s1, string s2) OneEditApart("cat", "dog") = false OneEditApart("cat", "cats") = true OneEditApart("cat", "cut") = true OneEditApart("cat", "cast") = true OneEditApart("cat", "at") = true OneEditApart("cat", "acts") = false 한개의 문자를 삽입, 제거, 변환을 했을때 s1, s2가 동일한지를 판별하는 OneEditApart 함수를 작성하시오. 출처 : http://www.careercup.com/question?id=479341..
-
<SQL> Programmers_오랜 기간 보호한 동물(1)데이터 분석 공부 2020. 7. 30. 20:55
문제 아직 입양을 못 간 동물 중, 가장 오래 보호소에 있었던 동물 3마리의 이름과 보호 시작일을 조회하는 SQL문을 작성해주세요. 이때 결과는 보호 시작일 순으로 조회해야 합니다. 데이터 타입 답 SELECT A.NAME, A.DATETIME FROM ANIMAL_INS A LEFT JOIN ANIMAL_OUTS B on A.ANIMAL_ID = B.ANIMAL_ID #B테이블 붙여서 # LEFT JOIN하는데, 이때, A와B의 특정 조건에 맞는 데이터들을 뽑아주지만, # A와 B의 조건 이외에 A테이블에서 데이터를 추가적으로 뽑을 수 있다. WHERE B.ANIMAL_ID is NULL # A와B 테이블 JOIN 했을 때, B에는 없지만, A에는 있는 것 ORDER BY A.DATETIME LIMIT..
-
<SQL> Programmers_동명 동물 수 찾기데이터 분석 공부 2020. 7. 29. 01:13
문제: 동물 보호소에 들어온 동물 이름 중 두 번 이상 쓰인 이름과 해당 이름이 쓰인 횟수를 조회하는 SQL문을 작성해주세요. 이때 결과는 이름이 없는 동물은 집계에서 제외하며, 결과는 이름 순으로 조회해주세요. 데이터 타입 보고 무의식적으로 select name, count(name) count from animal_ins group by name 코딩하여 풀려고 했는데, 결과가 다음과 같이 나왔다. 그렇다. count가 모두 1로 나왔다. 어떻게 해결을 해야 할까? GROUPY BY에 조건을 거는 HAVING절을 이용하면 쉽게 아주 쉽게 풀 수 있다. SELECT NAME, COUNT(NAME) COUNT FROM ANIMAL_INS GROUP BY NAME HAVING COUNT(NAME) >1 H..
-
머신러닝에 대한 기본적인 질문들Machine learning, Deep learning 2020. 7. 5. 20:59
1. 머신러닝을 어떻게 정의내릴까? -> 머신러닝은 어떤 데이터를 학습하는 데 필요한 하나의 시스템을 설계하는 것과 같다. 여기서 '학습'이란 어떤 데이터 작업에서 목표로 했던 성과 및 성능 지표가 업그레이드되게 하는 것을 말한다. 2. 머신러닝의 도움을 받을 수 있는 4가지의 유형은? -> 첫째, 뚜렷한 해결책이 보이지 않는 문제, 둘째, 수작업으로 만든 긴 규칙 리스트를 대체하는 경우 셋째, 변화하는 환경에 적응하는 시스템을 만드는 경우 넷째, 사람에게 통찰을 제공해야 하는 경우 3. 레이블링된 훈련 세트는 무엇인가? -> 각 데이터가 원하는 답이나 특징이 있는데, 로우 데이터에 이러한 특성을 부여하고, 이러한 특성을 부여받은 데이터 셋을 '레이블링된 훈련 세트'라고 한다. 4. 가장 널리 사용되는 ..