The-Movies-Dataset

Machine Learning Algorithms applied to The Movies Dataset to determine success factors.

Link to kaggle dataset: https://www.kaggle.com/rounakbanik/the-movies-dataset

Usage:

Data_Cleaning_PreProcessing.ipynb - the file which explores the data, cleans up, deals with JSON column for Genres, deals with Imbalanced classes problem, normalize the numerical columns (min-max scaling)

DimensionalityReductionPCA.ipynb - Apply PCA, selectKBest, selectPercentile

Gridsearch #4 XXX - Apply Gridsearch for each of the classifiers, find the best params for normal data and data with feature selection and/or dimensionality reduction.

The npy files are used to save data after pre-processing, and loading them subsequently.

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
.ipynb_checkpoints		.ipynb_checkpoints
Class Notebook		Class Notebook
ManualTweaking		ManualTweaking
.gitignore		.gitignore
Data_Cleaning_PreProcessing.ipynb		Data_Cleaning_PreProcessing.ipynb
DimensionalityReductionPCA.ipynb		DimensionalityReductionPCA.ipynb
Final project slides.pptx		Final project slides.pptx
FinalReport.pdf		FinalReport.pdf
GridSearch #4 Decision Tree.ipynb		GridSearch #4 Decision Tree.ipynb
GridSearch #4 KNN.ipynb		GridSearch #4 KNN.ipynb
GridSearch #4 Naive Bayes.ipynb		GridSearch #4 Naive Bayes.ipynb
GridSearch #4 SVM NonLinear.ipynb		GridSearch #4 SVM NonLinear.ipynb
Gridsearch #4 SVM Linear.ipynb		Gridsearch #4 SVM Linear.ipynb
README.md		README.md
data_array_formatted.npy		data_array_formatted.npy
data_array_non_formatted.npy		data_array_non_formatted.npy
data_kBest.npy		data_kBest.npy
data_pca.npy		data_pca.npy
data_select_percentile.npy		data_select_percentile.npy
initial Data Exploration.ipynb		initial Data Exploration.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

The-Movies-Dataset

About

Releases

Packages

Languages

muhammedyusuf678/The-Movies-Dataset-1

Folders and files

Latest commit

History

Repository files navigation

The-Movies-Dataset

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages