Dacon - 영화 관객 수 예측 모델 개발 - 1
데이콘 영화 관객 수 예측 모델 공부하며 다음에 다시 보기위해 작성. 데이터는 데이콘 사이트에 들어가면 있음. lightgbm 모델은 이번에 처음 사용해봄. lightgbm은 간단하게 속도가 빠른 것이 장점, 메모리를 적게 차지, 결과의 정확도도 높다, GPU도 활용 가능하다는 장점이 있다. 하지만, overfitting에 민감, 데이터의 크기가 작을 경우 기존의 머신러닝 알고리즘이 더 좋을 수 있음. 출처: https://greatjoy.tistory.com/72 -> 자세한 lightgbm은 여기서 train 데이터 확인 및 describe() 와 shape 확인. test에 한개가 적은 이유는 저 부분을 예측 해야되서 빔.(관객수 부분) 장르별 관객 수를 보아 느와르, 액션 부분이 관객 수가 높음...
2022.04.03