모듈화 작업
오늘 복기
충돌나면 안되니까 저번에 따로 만든 mysql로 하고있음. msle 열은 음수가 나온다고 안된다고 지웠고, 하이퍼파라미터튜닝 코드 끼워넣어서 best_params 열 만들어서 하고있는데
trainer에 하이퍼파라미터튜닝이랑 앙상블을 끼워넣으려 하니 되긴 되었는데 너무 아름답지가 않아. 사실 된건지도 잘 모르겠어. 제출하니까 점수가 이상해.
그냥 튜닝 끝나면 best_params로 yaml을 교체시키고 다시 학습시키는게 나을것같음.
앙상블은 처음만들어봣는데 이번엔 회귀문제니까 trainer가 끝나면 .joblib을 산출하게하고
LGBM_pure_time_10211143.joblib XGB_pure_time_10211133.joblib Catboost_pure_time_10211155_.joblib
.joblib 들을 soft voting으로 했는데 이것 역시 trainer에 끼워넣어서 model_name = “Ensemble” # LGBM/XGB/Catboost 이런식으로하려다가 그러니까 아까 trainer에 끼워놓은 하이퍼파라미터에 또 겹쳐서 얘만 따로 처리해야 되고 안예쁨.
init.py로 하려다가 그냥 따로 빼서 ensemble.ipynb만 따로 가져가는게 나을 것 같음.
더 만져볼거는 교차검증, 특성중요도?