전체 글

· PCA/2주차
1. Dot product 두 벡터가 있을 때, 두 벡터의 1) 길이 2) 사이의 각도 3) 거리를 구하기 위해서는 벡터 공간의 기하학적 특징(geometric properties in a vector space)과 관련이 있는 inner product(내적)가 필요하다. transpose를 취하는 것은 행렬간의 곱을 위한 size 조정이다. 1) 벡터의 길이는 자기 자신과 자기 자신의 transpose를 곱한 것에 루트를 씌운 것이다. 계산 자체는 각 원소를 제곱하여 더한 것에 루트를 씌운 것과 같다. 2) 두 벡터 사이의 거리는 두 벡터의 뺄셈의 norm을 구한 것과 같다. 3) 이제 코사인 법칙을 이용하여 두 벡터 사이의 각을 구할 수 있다. 코사인 알파(두 벡터 사이의 각)는 "두 벡터의 내적"을..
1. The Sandpit 간단한 함수에 대해서는 값이 최대가 되는 좌표가 어디인지 파악하기가 쉽다. 위 그래프는 Jacobian vector를 통해 표현한 것이다. 그러나 대부분은 이렇게 간단하지는 않다. 앞서 다루었던 복잡한 식을 표현하면 위와 같다. 여기서는 global maximum A와 local maximum C,E가 존재한다. 반대로 global minimum D와 local minimum B가 존재한다. 얼마나 가파른지에 대한(gradient) 정보를 각 좌표를 기준으로 표시하면 아래 그래프와 같다. 우리는 모든 것을 관망하는 입장에서 어디로 가야 가장 높은지 혹은 가장 낮은지를 알 수 있다. 하지만 실제로는 모든 데이터에 대한 정보를 파악하고 미리 알 수는 없으므로 마치 밤길을 거니는 것..
1. The Jacobian J is a vector pointing the direction of steepest slope of this function. J는 여러 개의 변수로 구성된 함수 f의 각 변수에 대해 편미분한 것들을 모아놓은 벡터이다. x,y축에 따른 z의 값이 표현된 좌표평면이다. z의 값이 클수록 밝게 표시되고, z의 값이 작을수록 어둡게 표시된다. 이를 등고선으로 표현하면 위와 같다. 여기서 어떤 것의 J 값이 가장 클까? z의 값이 가장 크다고 표현된 A의 J 값이 가장 크고, 가장 어두운 곳에 위치한 B의 J 값이 가장 작은 것이다. 2. Calculating the Jacobian Jacobian(편미분 벡터)를 구하기(3문제) Jacobian에 특정 값 대입하여 계산하기(2문..
1. Variables, constants & context time은 독립변수, speed는 종속변수다. 즉, speed가 time이 커짐에 따라 변화하는 것이지 그 반대가 아니라는 뜻이다. 우리는 이처럼 그래프가 지니는 의미를 파악하고 미분을 결정해야한다. 우리가 수행하는 미분은 '종속변수'에 대한 것이다. 이 예시에서 F는 a와 v에 의해 결정되는 종속변수라고 생각된다. 그리고 m과 d는 상수이다. 하지만 speed에 대한 식에 F가 영향을 주는 경우에서 F는 독립변수가 된다. 또 자동차를 제작하는 상황이라고 한다면 m,d도 독립변수가 될 수 있을 것이다. m에 관한 식에는 h,r,t,p(roh)라는 네 개의 변수가 존재한다. 따라서 1D에 대한 미분을 그대로 수행할 수 없다. 여러 개의 변수가 존..
1. Working with an AI team Specify your acceptance criteria 95%의 정확도를 어떻게 측정할 것인가? 이전에는 AI팀의 퍼포먼스를 측정하기 위해 제공되는 데이터셋을 test set이라고 했다. 이는 통계적으로 확인된다. 따라서 원하는 목표가 통계적으로 어떤 수치 달성을 원하는 것인지 명시할 필요가 있다. How AI teams think about data training set은 A와 B를 mapping할 수 있도록 만드는 input이 된다. 이를 기반으로 획득한 learning 알고리즘을 test set에 적용한다. Ptifall: Expecting 100% accuracy 굉장히 작은 균열만 있더라도 defect로 탐지할 수 있는 애매한 문제들도 존재한..
1. Every job function needs to learn how to use data Sales 인공지능의 발전은 sales 분야를 비롯한 여러 분야에 변화를 일으키고 있다. Data science를 기반으로 해서 machine learning은 이런 분류 작업을 자동으로 처리해준다. Manufacturing line manager 제조업 분야에서도 사람이 직접하던 검수를 인공지능을 통해 자동화하고 더 효율적인 공정 시스템을 만들 수 있다. Recruiting 채용 과정에 있어서도 머신러닝이 이력서 데이터를 기반으로 학습하여 인터뷰를 할 것인지 말 것인지를 판단할 수 있다. Marketing 어떤 방식을 취하는 것이 더 많은 사용자를 유치할 수 있을지에 대한 접근도 머신러닝을 이용하면 된다. 여..
chanmuzi
chanmuzi