1. Working with an AI team Specify your acceptance criteria 95%의 정확도를 어떻게 측정할 것인가? 이전에는 AI팀의 퍼포먼스를 측정하기 위해 제공되는 데이터셋을 test set이라고 했다. 이는 통계적으로 확인된다. 따라서 원하는 목표가 통계적으로 어떤 수치 달성을 원하는 것인지 명시할 필요가 있다. How AI teams think about data training set은 A와 B를 mapping할 수 있도록 만드는 input이 된다. 이를 기반으로 획득한 learning 알고리즘을 test set에 적용한다. Ptifall: Expecting 100% accuracy 굉장히 작은 균열만 있더라도 defect로 탐지할 수 있는 애매한 문제들도 존재한..
1. What is a Nerual Network? Housing Price Prediction size라는 input x를 받아 계산한 결과가 price라는 output y가 되고, 이것을 그래프로 표현한 것이다. input을 output으로 만들어주는 계산 과정이 포함된 부분을 도식화하면 동그라미가 되고, nueron이라고 한다. 위 그래프는 y의 값이 음수가 절대로 될 수 없기 때문에 y값이 전부 0으로 표현되는 수평한부분이 존재한다. 이런 형태의 그래프는 Rectified Linear Unit, ReLU 의 형태다. 지금 당장은 자세히 몰라고 되지만 향후 중요하게 다룰 내용이다. 지금은 single neuron만 존재하는 아주 간단한 형태의 neural network이고, 더 복잡한 NN을 만들기..
Part 1 Demand prediction nueral network의 가장 기본적인 형태 price, shipping cost, marketing, material 이라는 네 개의 input이 각각 affordability, awareness, perceived quality라는 요인에 영향을 주고, 이 세 개의 요인이 합쳐져 demand라는 output으로 이어진다. 충분한 데이터가 주어진다면 input에서 output으로 mapping하는 작업을 아주 잘 수행할 수 있게 된다. Part 2 (more complicated) Face recognition 컴퓨터는 각 필셀이 얼마나 밝은지를 "숫자"로 파악한다 1000 x 1000 픽셀로 구성된 사진이라면 1,000,000개의 픽셀을 데이터로 가지게..
A lesson from the rise of the Internet Internet Era: shopping mall + website != internet company A/B testing short iteration time decision making pushed down to engineers and other specialized roles AI era: Any company + deep learning != AI company strategic data acquisition: key of great AI company unifeid data warehouse pervasie automation new roles(e.g., MLE) and division of labor AI Transfor..
Machine learning vs. data science data science: 어떤 의사결정을 해야할지에 도움을 주는 분야 ex) 어떤 집을 사야하는가? science of extracting knowledge and insight from data machine learning filed of study that gives computers the ability to learn without being explicitly programmed. 어떤 고아고를 눌러야 하는지 알려주는 시스템 Deep learning 네 개의 input(A)를 통해 한 개의 output(B)를 만들어 냄 중간의 원들을 neuron(뉴런)이라고 부른다. Neural Network와 Deep learning은 요즘 거의 ..
Machine Learning Supervised Learning Input(A): email, audio, English... Output(B): spam, text transcript, Chinese... Application: spam filtering, speech recognition, machine translation Why now? AI가 급부상하게 된 것은 머신러닝과 인공신경망을 기반으로한 딥러닝의 발전 덕분이다. 발전 정도를 도식화하면 위와 같다. 따라서 우리는 large neural network와 big data가 필요하다고 말할 수 있다. What is data? Example of a table of data(dataset) A와 B 자리에는 무엇이든지 내가 원하는 것이 오게 될..