LDA
-
[텍스트] 토픽 모델링 & LDA머신러닝 & 딥러닝 2021. 11. 29. 20:35
토픽 모델링 문서들에 잠재되어 있는 공통된 주제를 추출하는 기법. 문서 군집화/유사도와 비슷한 기법이지만 주요 토픽의 분포도와 개별 토픽이 어떤 의미인지를 보여주는 단어들의 분포를 제공한다. 토픽 모델링 알고리즘 유형 LSA (Latent Semantic Analysis), pLSA LDA (Latent Drichlet Allocation) NMF (Non Negative Factorization) LSA와 NMF는 행렬 분해 기반 토픽 모델링 pLSA와 LDA는 확률 기반의 토픽 모델링 LDA (Latent Drichlet Allocation) LDA는 관찰된 문서내 단어들을 이용하여 베이즈 추론을 통해 잠재된 문서내 토픽 분포와 토픽별 단어 분포를 추론하는 방식. LDA 베이즈 추론의 사전 확률 분포..