전체 글126 [분석알고리즘] 회귀 | 2. 다중 회귀 (Multiple Regression) 회귀 분석 포스팅 시리즈의 일환으로 다중 회귀 분석에 대해 정리해 보겠습니다. 다중 회귀 분석 (Multiple Linear Regression) 이란? - 독립 변수 (Independent Variable) 가 여러 개로서 복합적으로 종속 변수에 영향을 미치는 회귀 분석을 의미합니다. 단순 선형 회귀 분석과 다른 점은 독립 변수가 여러 개 라는 것입니다. - 변수 Y 에 원인이 되는 변수가 여러개(n) 포함되는 형태로 표현이 됩니다. 하기와 같은 방정식으로 표현이 됩니다. - 여러 독립 변수 중에서도 종속 변수 에 영향을 주는 가장 중요한 변수가 무엇인지를 알 수 있습니다. 예를 들어, 하기 공식을 보면 자동차의 Co2 emission 에 대해 Cylinder 변수가 Engine size 보다 더 영향.. 2023. 12. 21. [분석알고리즘] 앙상블 | 4. 보팅 (Voting) 이번 포스팅에서는 앙상블 기법 중 보팅 (Voting)에 대해 정리해 보겠습니다. 앞서 소개한 배깅(Bagging) 과 부스팅(Boosting) 보단 중요성이 덜할 수 있지만 한 번 정리하는 것이 좋을 듯 하여 포스팅 하였습니다. 보팅 (Voting) 과 배깅 (Bagging) 의 차이 보팅(Voting) 은 약한 학습기들을 여러 개 생성하여 결합하는 배깅 방식과 꽤 차이가 있습니다. 보팅(Voting) 은 훈련 데이터 전체를 기반으로 서로 다른 여러 종류의 모델을 만들어 합친 형태인데 반해 배깅(Bagging) 은 붓스트랩된 샘플별로 다수의 동일한 타입의 모델들을 생성하여 합친 형태를 가집니다. 보팅 (Voting) 배깅 (Bagging) 데이터셋 동일한 데이터셋 사용 다른 데이터셋 사용 (각 예측 모.. 2023. 12. 18. [분석알고리즘] 앙상블 | 3. 부스팅 (Boosting) 이전 포스팅에서 앙상블 개념을 소개하며 크게 병렬적인 방식과 순차적인 방식이 나뉜다고 언급하였습니다. 이번 포스팅에서는 대표적인 순차적 방식인 부스팅(Boosting) 방법에 대해 다뤄 보도록 하겠습니다. 앞서 소개한 배깅 (Bagging) 과 어떤 차이가 있는지 집중해서 보시면 될 거 같습니다. 부스팅 (Boosting) 방식 이란? - 앙상블 기법 중 대표적인 순차적(Sequential) 방식입니다. 부스팅 방식은 여러 개의 약한 학습기 (weak learners) 들을 순차적으로 학습하며 예측력이 약했던 부분들을 개선해 나가는 방식입니다. - 분류 결과가 좋지 않았던(Previously mislabeled) 데이터들은 높은 가중치를 할당 받아 (Higher weight) 다음 붓스트랩핑 단계에서 다.. 2023. 12. 17. [분석알고리즘] 앙상블 | 2. 배깅(Bagging) 및 랜덤포레스트 (Random Forest) 이전 포스팅에서 앙상블 개념을 소개하며 크게 병렬적인 방식과 순차적인 방식이 나뉜다고 언급하였습니다. 이번 포스팅에서는 대표적인 병렬적인 방식인 배깅(Bagging) 에 대해 다뤄 보도록 하겠습니다. 배깅 (Bagging) 이란? 배깅(Bagging) 은 Boostrap Aggregating 의 약자입니다. 각 붓스트랩된 샘플에 대해 붓스트랩 방식와 모델링이 병렬적(parellel) 으로 이루어지는 대표적인 병렬 앙상블 기법입니다. 참고로, 배깅 방식은 회귀(Regression) 및 분류(Classification) 에 둘 다 이용될 수 있습니다. 붓스트랩 개념에 대한 설명은 다른 포스팅에서 다루었습니다. [분석알고리즘] 앙상블 | 개념 설명 [분석알고리즘] 앙상블 | 개념 설명 이번 포스팅에서는 앙상블.. 2023. 12. 17. 이전 1 2 3 4 5 6 7 8 ··· 32 다음