ĐH Bách Khoa TPHCM
ĐH Bách Khoa TPHCM
ĐH Bách Khoa TPHCM
ĐH Bách Khoa TPHCM
Bài tập lớn - Môn Học Máy (ML4U)
Bài toán Spaceship Titanic (Kaggle) yêu cầu dự đoán hành khách nào bị Transported. Chúng mình làm:
Transported
.Cabin → Deck/Side
, PassengerId → Group/Member
, chuẩn hoá chi tiêu.Kết quả: XGBoost vẫn dẫn đầu ổn định.
Transported
gần như cân bằng → thuận lợi cho phân loại. Age
→ cần chiến lược xử lý rõ ràng. 💡 Điểm cộng: nhờ Module Config rất robust, nhóm có thể thử nghiệm nhanh hàng chục pipeline (scale, PCA, impute, giữ missing) mà không cần chỉnh tay, giúp việc so sánh toàn diện và tái lập dễ dàng.