Spaceship Titanic — Dự đoán Dịch chuyển

Lê Chí Đại

ĐH Bách Khoa TPHCM

Nguyễn Quốc Huy

ĐH Bách Khoa TPHCM

Phạm Lê Tiến Đạt

ĐH Bách Khoa TPHCM

Võ Văn Thịnh

ĐH Bách Khoa TPHCM

Bài tập lớn - Môn Học Máy (ML4U)

Minh hoạ con tàu Spaceship Titanic đang du hành vũ trụ.
Một cú rẽ nhánh sai là… sang chiều không gian khác 🛸

Tóm tắt

Bài toán Spaceship Titanic (Kaggle) yêu cầu dự đoán hành khách nào bị Transported. Chúng mình làm:

Kết quả: XGBoost vẫn dẫn đầu ổn định.

Khám phá dữ liệu (EDA)

Biểu đồ phân phối biến mục tiêu Transported (True/False).
Transported gần như cân bằng → thuận lợi cho phân loại.
Heatmap hiển thị tỉ lệ giá trị thiếu theo cột.
Missing tập trung ở nhóm chi tiêu & một phần ở Age → cần chiến lược xử lý rõ ràng.

Tiền xử lý & Pipeline

Mô hình & Thiết lập

Kết quả & Phân tích

Biểu đồ top 15 mô hình theo F1.
Thí nghiệm
Phân phối hiệu năng của các mô hình
Phân phối hiệu năng của các mô hình
Leader Board
Top 15 pipeline tốt nhất và Top 15 pipeline tệ nhất

Nhận xét nhanh

💡 Điểm cộng: nhờ Module Config rất robust, nhóm có thể thử nghiệm nhanh hàng chục pipeline (scale, PCA, impute, giữ missing) mà không cần chỉnh tay, giúp việc so sánh toàn diện và tái lập dễ dàng.