머신러닝으로 필요한, 수학을 배우는 방법
머신러닝에 필요한 세 가지 기본 수학 분야 통계학, 선형대수학, 미적분학
■ 주요동향
많은 사람이 머신러닝에 관심을 가지지만, 수학에 대한 두려움으로 시작을 망설인다. 그러나 머신러닝에 필요한 수학은 생각보다 접근하기 쉬우며, 체계적인 학습을 통해 충분히 익힐 수 있다.
머신러닝은 엔지니어, 데이터 과학자 또는 기술 직종의 유형에 따라 각각의 수학능력이 필요하다.
실제로, 머신러닝과 AI 관련 연구는 대학보다는 대형 기술 기업에서 이루어지는 경우가 많으며 수학, 물리학, 컴퓨터 과학, 통계학, 공학 등의 학사 학위 수준의 수학 지식이 필요하다. 석사 또는 박사 학위를 보유하는 것이 좋지만 대부분의 머신러닝 관련 직무는 박사나 석사 수준의 수학 지식은 필요하지 않다.
연구 중심의 역할에서는 고급 수학 지식이 요구되지만, 산업 현장에서는 기초적인 수학 지식으로도 충분한 경우가 많기 때문이다.
- 연구직 (Research Scientist, Engineer 등) : 고급 수학 필수
- 산업계 실무직(ML 엔지니어, 데이터 과학자 등) : 기초 수학 개념
■ 현황분석
머신러닝을 위해 알아야 할 핵심 수학 분야로 ①통계학(Statistics), ②미적분학(Calculus), ③선형대수학(Linear Algebra)이 있다.
1. 통계학 (대부분의 머신러닝은 ‘통계학습이론’에서 유래되어, 통계학을 배우면 머신러닝의 기초를 익힐 수 있음)
가. 기술통계: 일반적인 데이터 분석 및 모델 진단에 유용하며, 데이터 요약 및 표현이 필요 (평균, 분산, 그래프 등)
나. 확률분포: 사건의 확률을 정의하는 통계의 핵심이며, 모든 분포에 대한 이해가 필요 (정규, 이항, 감마 분포 등)
다. 확률이론: 확률개념 이해 필수 (최대우도 추정, 중심극한정리, 베이지안 통계)
라. 가설검정: 대부분의 실무 데이터/머신러닝 활용으로 실서비스 적용하거나 A/B 테스트를 수행할 때 중요 (Z-검정, T-검정, 유의수준)
마. 회귀분석: 선형, 로지스틱, 다항회귀 등 모두 통계에서 시작된 모델 (잔차분석, 모델 불확실성, 일반화 선형 모델)
2. 미적분학 (대부분의 머신러닝 알고리즘은 ‘경사하강법’을 활용함)
가. 미분 : 도함수, 극값, 편미분, 연쇄법칙
나. 적분 : 면적/부피 계산, 치환적분 등
3. 선형대수학(선형대수도 머신러닝 전반에 사용되며, ‘딥러닝’ 및 ‘벡터 연산’에 필수임)
가. 벡터 : 내적(Dot Product), 외적(Vector Product), 연산(덧셈, 뺄셈 등)
나. 행렬 : 전치(Transpose), 역행렬(Inverse), 행렬식(Determinant)
다. 고윳값/고유벡터 : 고윳값 분해(Eigen-value Decomposition) 및 스펙트럼 분석(Spectrum Analysis)
■ 시사점
수학을 학습하면서 한 번에 하나씩, 단계별로 나누어 학습하는 방식이 중요하다. 특히 노트 정리하여 자신이 이해한 내용을 정리하는 방식이 필요하며, 최고의 자료를 찾는 게 아닌 자신의 말로 메모해두는 방식이 도움이 될 것이다.
<동향리포트>는 글로벌 과학기술문화, 과학·수학·정보 교육 분야의 정책 의사결정자들을 위한
국가별 정책, 연구조사보고서, 유관기관 동향 등 시의성 있는 유용한 정보를 제공합니다.