-
[n132] 선형 대수AI 부트캠프 2021. 9. 29. 10:02
선형 조합 (Linear Combination)
두 벡터를 스케일링하고 더하는 것을 선형 조합이라 한다. a, b는 scalars이다.
Span
벡터들의 선형 조합의 결과, 모든 조합을 Span이라 한다.
Basis
벡터 공간 V의 basis는 V를 채울 수 있는 선형 관계에 있지 않은 벡터들의 모음. (span과는 역개념)
Rank
매트릭스의 rank는 매트릭스 열을 이루고 있는 벡터들도 만들 수 있는 span 공간의 차원.
선형 종속 (Linear Dependent)
벡터들 중 하나가 다른 벡터들의 선형 조합으로 표현 가능하다.
선형 독립 (Linear Independent)
각 각의 벡터가 기존 스팬에 또 다른 차원을 추가 가능한 경우.
정사영 (Projection)
분산 (Variance)
데이터픠 퍼져있는 정도. 데이터의 스케일에도 영향을 받는다.
표준 편차
분산에서 제곱을 제거한 값.
공분산 (Covariance)
두 개의 데이터가 퍼져있는 정도를 나타낸다. 1개의 변수가 변화할 때, 다른 변수의 연관성을 나타낸다.
- 1번 그래프
- x값이 커질 때, y 값은 감소한다. 즉, 음의 공분산 값을 갖는다 라고 할 수 있다.
- 2번 그래프
- x와 y의 연관성을 알 수 없다. 즉, 0에 가까운 공분산 값을 갖는다.
- 3번 그래프
- x값이 커질 때, y값도 커진다. x값이 작아질 때 y 값도 작아진다. 즉, 양의 공분산 값을 갖는다.
상관계수 (Correlation coefficient)
공분산을 두 개의 표준 편차로 나눈 값이 상관계수이다. 공분산의 스케일을 조정할 수 있다. 공분산을 두 변수의 표준편차로 각각 나눠주면 스케일을 조정할 수 있으며 상관계수라고 부른다.
- 상관계수는 -1에서 1까지로 정해진 범위 안의 값만을 갖으며 선형연관성이 없는 경우 0에 근접.
- 공분산은 모든 값을 가질 수 있지만, 상관계수는 -1 ~ 1 사이로 정해져 비교하기가 쉽다.
- 공분산은 항상 스케일, 단위를 포함하고 있다.
- 상관계수는 데이터의 평균, 분산에 영향을 받지 않는다.
Orthogonality
두 벡터의 내적값이 0이면 서로 수직되어있다.
단위 벡터 (Unit Vectors)
단위 길이가 1인 벡터를 뜻한다.
부트캠프 공부 내용 한 눈에 보기
[인덱스] 코드 스테이츠 AI 부트캠프
구성 2021.09.09 ~ 2022.04 (총 28주) 배우는 내용 Section 1. 데이터 분석 입문 SPRINT 1. EDA SPRINT 2. Statistics SPRINT 3. DAY 1 EDA 데이터 전처리 Pandas in Colab 가설 검정 (t-test) T-Test 행렬 및 벡..
da-journal.com
'AI 부트캠프' 카테고리의 다른 글
[n134] Clustering (0) 2021.10.01 [n133] 고유벡터/고유값/PCA (0) 2021.09.30 [n131] 벡터 및 행렬 (0) 2021.09.28 [n124] 베이즈 정리 (0) 2021.09.24 [n123] 중심 극한 정리 및 신뢰 구간 (0) 2021.09.23 - 1번 그래프