Data Mining Techniques -- WordCloud and Classification

About

This is the first project of the course Data Mining Techniques developed by Ritsogianni Argyro and Triantafyllou Leonidas in the Spring semester of 2018. In this project we learned about some steps in Data Mining such as collection, pre-processing and transformation. We also implemented classification, using different classifiers such as Random Forests, Naive-Bayes, Support Vector Machines and K-Nearest Neighbor(our implementation using Majority Voting) and performed 10-fold Cross Validation measuring the following metrics: Precision, Recall, F-Measure and Accuracy. We used some tools and libraries which the instructors noted: SciKit Learn, pandas, gensim.This project is written in the programming language Python.

Project Structure

WordCloud implementation
Classification using Random Forests, Naive-Bayes, Support Vector Machines and K-Nearest Neighbor(our implementation using Majority Voting)
10-fold Cross Validation measuring Precision, Recall, F-Measure and Accuracy
Testing to find the best Classifier for our test set

Team Members and Contact Details

Ritsogianni Argyro: [email protected]
Triantafyllou Leonidas: [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
EvaluationMetric_10fold.csv		EvaluationMetric_10fold.csv
README.md		README.md
kfoldtest.py		kfoldtest.py
lsi_graph.py		lsi_graph.py
ourknn.py		ourknn.py
stop_words.txt		stop_words.txt
testSet_categories.csv		testSet_categories.csv
test_classification.py		test_classification.py
test_set.csv		test_set.csv
wcloud.py		wcloud.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Mining Techniques -- WordCloud and Classification

About

Project Structure

Team Members and Contact Details

About

Releases

Packages

Languages

leonidastri/data-mining-classification

Folders and files

Latest commit

History

Repository files navigation

Data Mining Techniques -- WordCloud and Classification

About

Project Structure

Team Members and Contact Details

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages