ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [n132] 선형 대수
    AI 부트캠프 2021. 9. 29. 10:02

    선형 조합 (Linear Combination)

    두 벡터를 스케일링하고 더하는 것을 선형 조합이라 한다. a, b는 scalars이다.

     

    Span

    벡터들의 선형 조합의 결과, 모든 조합을 Span이라 한다. 

     

    Basis

    벡터 공간 V의 basis는 V를 채울 수 있는 선형 관계에 있지 않은 벡터들의 모음. (span과는 역개념)

     

    Rank

    매트릭스의 rank는 매트릭스 열을 이루고 있는 벡터들도 만들 수 있는 span 공간의 차원.

     

    선형 종속 (Linear Dependent)

    벡터들 중 하나가 다른 벡터들의 선형 조합으로 표현 가능하다.

     

     

    선형 독립 (Linear Independent)

    각 각의 벡터가 기존 스팬에 또 다른 차원을 추가 가능한 경우.

     

     

    정사영 (Projection)

     

     

    분산 (Variance)

    데이터픠 퍼져있는 정도. 데이터의 스케일에도 영향을 받는다.

     

    표준 편차

    분산에서 제곱을 제거한 값.

     

     

    공분산 (Covariance)

    두 개의 데이터가 퍼져있는 정도를 나타낸다. 1개의 변수가 변화할 때, 다른 변수의 연관성을 나타낸다.

    • 1번 그래프
      • x값이 커질 때, y 값은 감소한다. 즉, 음의 공분산 값을 갖는다 라고 할 수 있다.
    • 2번 그래프
      • x와 y의 연관성을 알 수 없다. 즉, 0에 가까운 공분산 값을 갖는다.
    • 3번 그래프
      • x값이 커질 때, y값도 커진다. x값이 작아질 때 y 값도 작아진다. 즉, 양의 공분산 값을 갖는다. 

     

     

    상관계수 (Correlation coefficient)

    공분산을 두 개의 표준 편차로 나눈 값이 상관계수이다. 공분산의 스케일을 조정할 수 있다. 공분산을 두 변수의 표준편차로 각각 나눠주면 스케일을 조정할 수 있으며 상관계수라고 부른다.

    • 상관계수는 -1에서 1까지로 정해진 범위 안의 값만을 갖으며 선형연관성이 없는 경우 0에 근접.
    • 공분산은 모든 값을 가질 수 있지만, 상관계수는 -1 ~ 1 사이로 정해져 비교하기가 쉽다.
    • 공분산은 항상 스케일, 단위를 포함하고 있다.
    • 상관계수는 데이터의 평균, 분산에 영향을 받지 않는다.

     

    Orthogonality

    두 벡터의 내적값이 0이면 서로 수직되어있다.

     

    단위 벡터 (Unit Vectors)

    단위 길이가 1인 벡터를 뜻한다.

     

     

    부트캠프 공부 내용 한 눈에 보기

     

    [인덱스] 코드 스테이츠 AI 부트캠프

    구성 2021.09.09 ~ 2022.04 (총 28주) 배우는 내용 Section 1. 데이터 분석 입문 SPRINT 1. EDA SPRINT 2. Statistics SPRINT 3. DAY 1 EDA 데이터 전처리 Pandas in Colab 가설 검정 (t-test) T-Test 행렬 및 벡..

    da-journal.com

     

    'AI 부트캠프' 카테고리의 다른 글

    [n134] Clustering  (0) 2021.10.01
    [n133] 고유벡터/고유값/PCA  (0) 2021.09.30
    [n131] 벡터 및 행렬  (0) 2021.09.28
    [n124] 베이즈 정리  (0) 2021.09.24
    [n123] 중심 극한 정리 및 신뢰 구간  (0) 2021.09.23

    댓글