본문 바로가기
직장인과 문과생을 위한 수학교실 (직문수)

9강. 현대수학에서 미분법의 직관과 의미

by EnjoyingMath 2023. 8. 4.
반응형

다음 포스팅은 https://youtu.be/2ulgaG7BUgU 의 영상에서 작성한 노트의 핵심을 정리한 것입니다. 여러 오탈자 및 수정 사항들이 있을 수 있습니다. 노트 내용에 대한 디테일한 설명들은 영상을 참고하시길 바랍니다.

 

시작하며 특히나 통계학, 기계학습을 공부하시는 분들께 $Z=F(x,y)$에 대해 Gradient Vector ▽$f$의 정의가 무엇이냐고 질문하면 

▽$f=(\frac{af}{ax},\frac{af}{ay})$가 마치 절대적인 사실인 것처럼 잘못 알고있는 경우가 너무 흔합니다. $(*)$는 오직 미분을 수행하는 공간이 '유클리드 공간' 이라는 전제 하에서만 참입니다. 만약에 공간이 평평한 형태가 아닌 

 

 

등등과 같이 생긴 경우에는 $(*)$는 결코 성립하지 않습니다.

 

매우 빈번하게 사용되는 미분법들

 

1) The usual (=Euclidean) Differentiation (유클리드) 미분 : 가장 많이 쓰임

2) The Covariant Differentiation (공변) 미분: 주로 상대성 이론, 미분기하학에서 사용

3)The Partial Differentiation : 모든 수학에서 사용

4)The Ito, Stratonovich Differentiation : 확률변수의 미분법, 확률론, 통계, 금융공학...

5)The Weak Differentiation : 편미분 방정식에서 사용

 

지금까지 살펴본것

 

  • 수학적 논리의 토대로서 공리 체택의 필요성
  • 함수의 정의, 함수간이ㅡ 합성과 역함수의 존재성, 군의 관점
  • 선형연산과 벡터공간, 선형함수; 행렬의 도입
  • 역행렬과 행렬식, 평행사변형의 '면적'이라는 기하학적 관점
  • 벡터공간에서의 'shape', 즉 벡터의 크기 및 벡터간의 각도는 벡터공간의 고유특성이 아닌 '내적' (inner product)의 특성이다
  • 내적은 이에 대응하는 행렬 $\left(\begin{array}{l}a&b\\c&d\end{array}\right)$과 같은 정보량이며, 이 행렬은 언제나 $Q D Q^{-1}$ 형태와 같다. (무지개 정리)

고유벡터 (eigenvector), $\lambda_1, \lambda_2$를 고유치 (eigenvalue) 이다. 

 

 

  • 위 그림들까지 해서 벡터공간 $R^{2}$에 대해서 의미들을 살펴보면 다음과 같습니다. 

 

  • 내적을 변경하면 같은 두 벡터 $u,w$에 대해 크기들 및 각도를 다른 값들을 갖는 것으로 해석해야 타당합니다. 크기 및 각도는 내적이 주어진 이후에 내적을 토대로 정의하는 것이기 떄문입니다.
  • 지금까지 했던 모든 이야기들 중에서 실상 우리가 해야하는 계산은 오직 숫자간의 덧셈과 곱셈 뿐이며 나머지는 해석의 방식에 대한 것입니다.
  • 해석은 절대적인 진리가 아니며, 같은 대상의 다른 해석들도 있을 수 있습니다.

 

미분법이란? 

주어진 공간이 벡터공간 (즉 선형연산이 잘 정의되는 평평한 공간) 여하와 상관없이 공간위에 '벡터'를 만드는 방법들을 지칭한다.

가령 구 (sphere)를 생각해보자.

 

 

 

 

구는 벡터공간과 거리가 먼 공간이다. 그럼에도 구의 각 점마다 그 점을 시점으로 갖는 벡터를 만들고자 한다.

 

그런데, '벡터'란 벡터공간의 원소를 지칭하므로, 위의 그림이 make sense하려면 각 벡터가 원소로서 속하는 벡터공간들이 주어져야 한다.

 

 

 

즉, 구위의 각 점이 벡터공간 $(R^2)$의 원점(영벡터)가 되도록 각 점마다 평면을 위에서 붙히는 것이다. 이러한 평면들을 접평면 (tangent space)라고 부르며, 접평면들은 벡터 공간으로, 각 접평면마다 그에 속하는 벡터들을 하나씩 골랐던 것으로 해석하면 첫 그림이 make sense해진다.

 

 

 

 

 

 

 

더 나아가서, 각 접평면마다 내적들을 할당하되 벡터들의 크기와 각도가 정해지게 하여 공간이 국소적 생김새가 정해짐으로서 결과적으로 공간 전체의 생김새가 '구'가 되도록 내적들을 주는 것이다.

 

  • 한마디로 요약하면, 미분은 공간위의 각 점에서 공간을 선형화한 접평면에 속한 벡터를 할당하되 내적을 토대로 정량적 의미를 부여하는 것이다.
  • '구'위에서 살펴본 이야기를 함수의 그래프를 '공간'으로 바라보고 옮겨보자.

 

함수 $f: \mathbb{R} \longrightarrow \mathbb{R}$에 대하여, 함수의 그래프에 해당하는 집합

        $x|\longrightarrow{fx}$

 

$\{x,y)\in\mathbb{R}^{2}:y=f(x)\text{for some}\\x\in\mathbb{R}$을 고려하자.

 

 

 

구위에서 했던 것처럼, 그래프 위의 각 점에서 '접선'을 세울 수 있다.

 

 

 

 

 

여기서 각각의 보라색 접선은 접선과 그래프가 만나는 검을 원점으로 갖는 실수축 $\mathbb{R}$로 간주 할 수있다. 

 

 

각 접선 위에서 화살표는 접선의 기울기 ($\frac{y의 변화량}{x의 변화량}$으로 정의, 아래 정의 참조)

값으로 할당하는게 자연스럽다

 

 

이 화살표를 결정하는 것을 일변수 함수의 미분법이라고 정의한다.

 

 

일변수 함수의 미분의 정의

 

1. $\mathbb{R}^{2}$위의 두 점 $(x_1,y_1)$, $(x_2,y_2)$의 기울기는 $\frac{y_2-y_1}{x_2-x_1}$으로 정의한다.

 

 

 

2. 함수 $f: \mathbb{R} \longrightarrow \mathbb{R}$에 대해 임의의 0이 아닌 숫자 $h$에 대해서 두 점 $(x,f(x))$와 $(x,y,f(x+h))$를 고려하자.

 

 

 

 

 

두 점 사이의 기울기는 (1)에 의하여 

$\frac{f(x+h)-f(x)}{x+h-x}=\frac{f(x+h)-f(x)}{h}$이다. 

 

 

이 때$h$를 한없이 0에 가깝게 만드는 것을 "lim"으로 표기한다.

 

만약에 $\frac{f(x+h)-f(x)}{h}$에 대해 $h$를 한없이 0에 가깝게 만든 $lim\frac{f(x+h)-f(x)}{h}$이 존재한다면 우리는 이 값을 함수 $y=f(x)$의 

 

미분계수 (derivative)라고 부르며 $f'(x)$로 표시한다.

 

미분계수에 대한 이모저모

  • 함수 $(y=f(x))$로부터 미분계수 $f'(x)$를 구하는 것을 대개 '함수'를 미분한다고 말한다.
  • 기울기의 의미상 미분계수 $f'(x)$는 x위에서 접선의 기울기를 뜻한다.
  • 미분계수의 형태에서 분모 $h$는 $h$가 0으로 한없이 가까이 가므로 미분계수가 존재하려면 적어도 분자인 $f(x+h)-f(x)$도 $h$가 0으로 한없이 가까이 갈 때에 마찬가지로 0으로 가까이 가야만 비로소 분수꼴이 정의 될 수 있다. 즉, $lim(f(x+h)=f(x)$을 함수 $y=f(x)$가 $x$에서 연속 이라고 부른다. 즉 함수의 미분계수가 존재하려면 적어도 함수는 연속이어야 한다.
  • 함수가 연속이라고 해서 미분계수가 존재하는 것은 아니다.

 

  • 두 함수  $f: \mathbb{R} \longrightarrow \mathbb{R}$,  $g: \mathbb{R} \longrightarrow \mathbb{R}$가 모두 미분계수 $f'(x), g'(x)$가 임의의 $x∈\mathbb{R}$에 대해서 존재한다고 가정하자. 그러면 합성함수  $g\circ{f}: \mathbb{R} \longrightarrow \mathbb{R}$ $x|\longrightarrow{g(f(x))}$ 또한 임의의 $x∈\mathbb{R}$에 대해 미분계수가 존재하며 다음과 같은 형태로 주어진다.

$(g\circ{f})(x)=g'(f'(x))f'(x)$

 

 

질문 일변수함수 $y=f(x)$의 미분법을 토대로 이변수 함수 $f: \mathbb{R}^{2} \longrightarrow \mathbb{R}$ $(x,y)|\longrightarrow{f}(x,y)$의 미분법을 어떻게 정의하는게 자연스러울까요?

 

반응형