전체 글126 [분석알고리즘] 앙상블 | 1. 개념 설명 이번 포스팅에서는 앙상블 (Ensemble) 에 대해 정리해 보겠습니다. 앙상블 (Ensemble) 이란? 일전에 분류 알고리즘인 의사 결정 나무 (Decision Tree) 에 대해 포스팅을 한 적이 있습니다. 단일 결정 나무 (One decision tree) 의 경우 모델을 직관적으로 이해할 수 있고, 데이터 스케일의 영향을 받지 않는다는 장점이 있으나, 과대적합(Overfitting) 의 가능성이 높다는 단점이 있습니다. 이러한 단점을 보완하기 위해 앙상블 기법이 제안되었습니다. 앙상블은 여러 예측 모형들을 결합하여 최종 예측 모형을 만드는 기법입니다. 여러 모델을 결합하여 성능 높였기 때문에 일반적으로 모델의 예측력이 좋은 것으로 알려져 있습니다. 앙상블 기법 중 병렬적 방법은 여러 예측 모형들.. 2023. 12. 16. 베이즈 정리 (Bayes' Theorem) 이번 포스팅에서는 조건부 확률과 베이즈 정리를 포스팅 해보겠습니다. 조건부 확률 (Conditional Probability) 이란? 조건부 확률은 이미 어떤 사건 B 가 일어난 조건 (given) 에서 A 가 일어났을 때 확률을 의미하며, P(A | B) 로 표기합니다. P(A | B) 두 사건의 독립 위에서 소개한 조건부 확률과 달리, 두 사건 A, B 가 일어났을 때 한 사건이 다른 사건이 일어날 확률에 영향을 주지 않으면 두 사건은 독립사건 이라고 합니다. 예를 들어 주사위나 동전을 두 번 던지는 경우가 될 수 있습니다. 첫번째 던진 동전이 앞이 나오건 뒤가 나오건 두번째 동전이 나오는 결과에 영향을 주지 않습니다. 베이즈 정리 지금부터 조건부 확률에서 파생된 베이즈 정리를 정리해 보겠습니다. 베.. 2023. 12. 12. Python | 값 변환하기 (조건 포함) 이번 포스팅에서는 파이썬 판다스 (Pandas) 데이터 프레임 (DataFrame) 내 에서 특정 조건에 따라 어떤 값들을 다른 값으로 변환하고자 할 때 사용할 수 있는 방법을 정리해 보겠습니다. 전처리를 하는 과정에서 범주형(categorical) 데이터를 숫자형 데이터로 간단하게 변환 시키고 싶을 때 등에서 활용 할 수 있습니다. 예시 데이터로 Kaggle 의 body performance 데이터를 이용해 보겠습니다. https://www.kaggle.com/datasets/kukuroo3/body-performance-data Body performance Datamulti class classificationwww.kaggle.com body performance 데이터를 로드 하면 하기와 같.. 2023. 11. 24. [주식] 기업 적정 가치 파악하기 (관련 지표: PER, PSR, ROE, EPS) 시가 총액 (Market Capitalization, Market cap) 시가총액은 쉽게 말해 이 기업이 얼마 짜리 기업인가를 의미한다. 주식 1주당 가격에 발행된 주식 수를 곱해서 계산된다. = 주식 1주당 가격 X 주식 발생수 기업가치 (Enterprise Value): 해당 기업을 인수한다면 얼마를 지불해야 하는가... 해당 기업을 인수하고자 한다면, 가지고 있는 부채도 지불해야 하므로 부채도 더한다. = 시가총액 + 부채 - 기업이 보유한 현금 기업 가치와 관련된 몇 가지 지표를 정리해 보겠다. 기본적으로 그 기업의 시가 총액 대비 그 기업의 매출 또는 순이익, 자산을 비교하여 가치를 산출하는 거 같다. PER (Price Earning Ratio) PER = 시가총액 / 순이익 = 주식 1주의.. 2023. 11. 9. 이전 1 ··· 3 4 5 6 7 8 9 ··· 32 다음