1. Working with an AI team Specify your acceptance criteria 95%의 정확도를 어떻게 측정할 것인가? 이전에는 AI팀의 퍼포먼스를 측정하기 위해 제공되는 데이터셋을 test set이라고 했다. 이는 통계적으로 확인된다. 따라서 원하는 목표가 통계적으로 어떤 수치 달성을 원하는 것인지 명시할 필요가 있다. How AI teams think about data training set은 A와 B를 mapping할 수 있도록 만드는 input이 된다. 이를 기반으로 획득한 learning 알고리즘을 test set에 적용한다. Ptifall: Expecting 100% accuracy 굉장히 작은 균열만 있더라도 defect로 탐지할 수 있는 애매한 문제들도 존재한..
Machine learning
1. Every job function needs to learn how to use data Sales 인공지능의 발전은 sales 분야를 비롯한 여러 분야에 변화를 일으키고 있다. Data science를 기반으로 해서 machine learning은 이런 분류 작업을 자동으로 처리해준다. Manufacturing line manager 제조업 분야에서도 사람이 직접하던 검수를 인공지능을 통해 자동화하고 더 효율적인 공정 시스템을 만들 수 있다. Recruiting 채용 과정에 있어서도 머신러닝이 이력서 데이터를 기반으로 학습하여 인터뷰를 할 것인지 말 것인지를 판단할 수 있다. Marketing 어떤 방식을 취하는 것이 더 많은 사용자를 유치할 수 있을지에 대한 접근도 머신러닝을 이용하면 된다. 여..
Self-driving car Can do: 센서를 통해 사물을 감지하고 다른 차가 어딨는지 파악할 수 있다. Cannot do: 사람이 뻗은 손 모양을 보고 이것이 stop, hitchhiker, bike turn left signal인지 구분할 수 없다. 인간 의도를 파악하기는 쉽지 않다. 1. Data 획득의 어려움 2. Need high accuaracy X-ray diagnosis Can do: Diagnose pneumonia from 10,000 labeld images Cannot do: Diagnose pneumonia from 10 images of a medical textbook chapter explaining pneumonia Strengths and weaknesses of m..
A lesson from the rise of the Internet Internet Era: shopping mall + website != internet company A/B testing short iteration time decision making pushed down to engineers and other specialized roles AI era: Any company + deep learning != AI company strategic data acquisition: key of great AI company unifeid data warehouse pervasie automation new roles(e.g., MLE) and division of labor AI Transfor..
Machine learning vs. data science data science: 어떤 의사결정을 해야할지에 도움을 주는 분야 ex) 어떤 집을 사야하는가? science of extracting knowledge and insight from data machine learning filed of study that gives computers the ability to learn without being explicitly programmed. 어떤 고아고를 눌러야 하는지 알려주는 시스템 Deep learning 네 개의 input(A)를 통해 한 개의 output(B)를 만들어 냄 중간의 원들을 neuron(뉴런)이라고 부른다. Neural Network와 Deep learning은 요즘 거의 ..
Machine Learning Supervised Learning Input(A): email, audio, English... Output(B): spam, text transcript, Chinese... Application: spam filtering, speech recognition, machine translation Why now? AI가 급부상하게 된 것은 머신러닝과 인공신경망을 기반으로한 딥러닝의 발전 덕분이다. 발전 정도를 도식화하면 위와 같다. 따라서 우리는 large neural network와 big data가 필요하다고 말할 수 있다. What is data? Example of a table of data(dataset) A와 B 자리에는 무엇이든지 내가 원하는 것이 오게 될..