머신러닝
-
분류 학습이란?데이터 분석 공부 2020. 8. 9. 13:49
머신러닝, 다르게 표현하면 '데이터 분석'은 크게 1. 데이터 가공/변환 2. 모델 학습/예측 3. 평가 이렇게 3가지의 단계로 이뤄진다. 이때, 모델 학습을 할 때, 레이블링된 특정 값이 있고, 머신러닝이라고 하면 크게 분류/회귀가 가장 많이 사용되기도 하고, 다양하게 학습을 해볼 수 있는 것이다. 오늘은 분류 학습이 무엇인지를 간략하게 적어보고 다음 Step으로 넘어가려 한다. 먼저, 지도학습이란 - 어떤 Raw Data에 특정 값이 입력된(레이블링) 셋이 있고 - 이러한 명시적 답이 주어진 데이터셋이 있을 때, 학습을 하는 머신러닝 방식이다. 다양한 분류 머신러닝 알고리즘 - 베이즈 통계와 생성 모델을 기반한 나이브 베이즈(Naive Bayes) - 독립 변수와 종속 변수의 선형 관계에 기반한 로지..
-
머신러닝에 대한 기본적인 질문들Machine learning, Deep learning 2020. 7. 5. 20:59
1. 머신러닝을 어떻게 정의내릴까? -> 머신러닝은 어떤 데이터를 학습하는 데 필요한 하나의 시스템을 설계하는 것과 같다. 여기서 '학습'이란 어떤 데이터 작업에서 목표로 했던 성과 및 성능 지표가 업그레이드되게 하는 것을 말한다. 2. 머신러닝의 도움을 받을 수 있는 4가지의 유형은? -> 첫째, 뚜렷한 해결책이 보이지 않는 문제, 둘째, 수작업으로 만든 긴 규칙 리스트를 대체하는 경우 셋째, 변화하는 환경에 적응하는 시스템을 만드는 경우 넷째, 사람에게 통찰을 제공해야 하는 경우 3. 레이블링된 훈련 세트는 무엇인가? -> 각 데이터가 원하는 답이나 특징이 있는데, 로우 데이터에 이러한 특성을 부여하고, 이러한 특성을 부여받은 데이터 셋을 '레이블링된 훈련 세트'라고 한다. 4. 가장 널리 사용되는 ..
-
CS231n_Lecture3_Loss Function and OptimizationMachine learning, Deep learning 2020. 6. 28. 21:33
회사에서 머신러닝/딥러닝 스터디에 합류를 자청했다. 뭔가 데이터를 공부한다고 해서 이쪽 분야에 대한 공부의 필요성을 느꼈기 때문이다. 앞으로 매주 들은 강의와 수업 내용을 간략하게 정리해서 업데이트 해보려 한다. 다만, 나중에 내가 복습을 할 때, 정말 짧고 간략하게 쓰면서 쉽고 빠르게 내용을 복기하는데 도움이 되는 방향으로 글을 적으려 한다. 다른 기본 코딩은 깃허브를 활용하려 한다. 데이터 파이프라인 설계와 같은 쪽도 공부를 고려 중인데, 너무 급할 일은 아니기 때문에 텐서플로우 자격증 취득과 클라우드 자격증 취득 후 시작하지 않을까 싶다. 2강 복습 컴퓨터가 이미지 인식에는 카메라가 어떤 각도에 있냐, 조면, 변형, 은폐/은닉, 배경과의 구별 모호, 클래스 내의 variation의 장애물이 있다. ..
-
음성인식 기술을 통해 바라보는 데이터 사회데이터 경제(Data Economy) 2020. 1. 5. 14:01
최근 컴퓨터와 전자기기의 괄목할만한 기술 성장덕분에 음성인식 기술 시장도 뒤따라 커지고 있다. 미국 IT전문 매체의 조사에 따르면 2029년에는 이 시장이 150억 달러에 이를 것으로 전망하고 있다. 현재 한국에서 스마트 스피커를 쓰는 사람들은 한정된 기능와 부족한 성능 때문에 실망을 하고 있다. 하지만, 미국의 상황은 조금 다른 듯 하다. 스마트 스피커의 성능과 범용성, 활용성, 효율성 등 다양한 측면에서 한국보다 발전한 양상을 보이고 있다. 단적인 예를 들어보자. 최근 구글은 스마트폰 픽셀4와 페이스북이 발표한 인공지능 비서 '자비스'는 가까운 미래에 인간의 노동력을 대체할 수 있을 것이라는 전망이 나오고 있다. 그리고 스마트홈, 스마트시티 등에 필요한 IoT 기술 영역에서도 두각을 나타낼 수 있는 ..