전체 글126 [예측성능평가] 모델 성능 평가 기법 (Model Performance Evaluation) 머신 러닝을 통해 구현한 학습 모델이 얼마나 실제 종속 변수를 정확하게 예측하는지를 평가할 수 있습니다. 이 때, 모델링 전 데이터 분할 단계에서 분할해 놓은 평가 데이터 (Test data) 를 이용할 수 있는데요. 모델이 예측한 값 vs. 실제 y 값 (y_hat (또는 y_pred) vs. y_test) 을 비교하여 기본적으로 실제 y 값과 많이 일치할수록 해당 모델의 성능은 적정한 것으로 평가 된다고 볼 수 있습니다. 이 때 일치 여부에 대해 정량화된 지표를 활용할 수 있는데 이를 성능 평가 지표 라고 합니다. 오늘은 몇 가지 성능 평가 지표에 대해 정리하여 포스팅 해보겠습니다. 성능 평가 지표는 크게 회귀 분석과 분류 분석에 따라 나뉠 수 있습니다. 평가지표 회귀분석 성능 지표 (주로 실제 y값.. 2023. 11. 8. python | 시각화 (Visualization), Matplotlib으로 여러 개 그래프 그리기 시각화를 하다 보면 여러 개의 그래프를 한 화면에 동시에 그리게 되는 일이 종종 생기는데요. Matplotlib 을 이용한 몇 가지 방법을 정리해 보고자 합니다. Matplotlib 을 이용한 subplot 을 그리는 방법 입니다. 비슷하면서도 조금씩 다른 방법들 입니다. plt.subplot() plt.subplot(nrows, ncols, num) i.g>> plt.subplot(2, 3, 1) 의 경우: - 총 2행 3열로 정렬된 6개의 그래프를 그리되 그 중 1번째 그래프를 말함 plt.subplot() 으로 배열 및 위치를 지정한 다음 plt.plot() 으로 그래프를 그립니다. plt.subplot() 안에 그래프들의 특정 위치를 지정합니다. plt.subplot(2, 3, 1) 의 경우, 총.. 2023. 10. 26. Python | pandas.index.difference() (판다스.인덱스.difference) 이번 포스팅에서는 pandas.index.difference (판다스 인덱스 difference) 에 대해 정리해 보겠습니다. pandas.index.difference (판다스 인덱스 difference) 기본 포맷 및 파라미터 pandas.index.difference 는 두개의 판다스 인덱스 객체를 비교한 후 인덱스1 엔 있지만 인덱스 2엔 없는 요소만 인덱스 형태로 반환합니다. 포맷 및 파라미터는 하기와 같습니다. 인덱스1.difference(인덱스2, sort=None) sort 는 기본값으로 None 이지만 False 나 True 를 설정할 수 있습니다. False 로 설정할 경우 원래 인덱스 순서입니다. pandas.index.difference (판다스 인덱스 difference) 활용법 .. 2023. 10. 26. [데이터 전처리] 데이터 스케일링 (Scaling) 출처: Coursera Data Analysis with Python Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science www.coursera.org .. 2023. 10. 25. 이전 1 ··· 4 5 6 7 8 9 10 ··· 32 다음