"topic:skewed-data" — Search

Trying to recogize and predict fraud in financial transactions is a good example of binary classification analysis. A transaction either is fraudulent, or it is genuine. What makes fraud detection especially challenging is the is the highly imbalanced distribution between positive (genuine) and negative (fraud) classes.

Jupyter Notebook11Updated 7 years ago

auprcbinary-classificationfraud-detectionskewed-dataxgboost

bharatc9530/Spam-Email-Classification

No description provided.

Jupyter Notebook10Updated 5 years ago

data-sciencehamheroku-deploymentlogistic-regressionmachine-learningnaive-bayes-classifierskewed-datasmsspamstandard-classifiers

AbbasElHachem/qcpcp

Space-Time Statistical Quality Control of Extreme Precipitation Observation

Python10Updated 3 years ago

box-coxkrigingoutlier-detectionprecipitation-datapythonskewed-data

charumakhijani/advanced-house-price-prediction

No description provided.

Jupyter Notebook11Updated 5 years ago

data-visualizationelastic-net-regressionensemble-modelsexploratory-data-analysisgradient-boosting-regressionhouse-price-predictionkaggle-competitionkernel-ridge-regressionkfold-cross-validationlasso-regressionlgbmregressormissing-value-treatmentone-hot-encodingoutlier-detectionrandom-forest-regressionrmse-scorescalingskewed-datasupport-vector-regressionxgbregressor

ihdavjar/CSL2050_Major_Project

Course Major Project of Pattern Recognition and Machine Learning( CSL2050 )

Jupyter Notebook10Updated 2 years ago

deep-neural-networksmachine-learningparkinsons-diseaseskewed-data

vaitybharati/A8-Aczel-problems-practice-1-48-1-51-1-53-

No description provided.

Jupyter Notebook10Updated 5 years ago

box-plotmeanmedianmodeoutlier-detectionpythonskewed-datastandard-deviationsymmetryvariance

gaju-01/ClientPulse

This is a data mining model to predict client behavior within an organization, enabling better alignment with client needs. The model determines whether clients are likely to churn using advanced data preprocessing and imbalanced learning techniques. The dataset for this analysis was sourced from Kaggle.

Jupyter Notebook10Updated 1 year ago

artificial-intelligenceclassificationdata-miningdata-visualizationimbalanced-learningmachine-learningpython3skewed-data

ac12644/Fraud-Detection-AI

Build predictive models on highly skewed data by selecting an example of fraudulent transactions in the financial institutions🚀

Jupyter Notebook10Updated 3 years ago

analyticsdata-miningdata-sciencedata-visualisationfraud-detectionfraud-preventionmachine-learningmachine-learning-algorithmssampling-methodsskewed-data

MathCortes/Projeto7-WineSamples-ML_Clustering

A base possui informações obtidas de análises químicas de vinhos da mesma região da Itália, porém são provenientes de 3 diferentes cultivadores. A análise mostra a quantidade de 13 componentes achados em cada um dos 3 tipos de vinhos.

Jupyter Notebook00Updated 3 years ago

data-sciencek-means-clusteringmachine-learningpca-analysispreprocessingskewed-data

Daniel-Carpenter/Delivery-Service-ETA-PredictionArchived

Predicting Time of Arrival for Food Delivery Service

R02Updated 3 years ago

decision-treesdeep-learningelastic-netimputationmachine-learningmarspcrrskewed-data

LKEthridge/SDA_Project

A Statistical Data Analysis project from TripleTen

Jupyter Notebook00Updated 1 year ago

binomial-distributioncontinuous-variablesdata-aggregationdata-manipulationdata-preparationdistributionfrequency-histogramhypothesis-testslaw-of-large-numbersnormal-approximationnormal-distributionone-tail-testpaired-samplesprobability-theoryrandom-samplingskewed-datastandard-deviationstatistical-data-analysissummary-statisticstwo-tail-test

MateJozsaPhys/CNDinvestigation

Opportunities and challenges in partitioning the graph measure space of real-world networks

Jupyter Notebook00Updated 5 years ago

affiliation-networksbrain-networkscomplex-networksfeature-extractionfeature-selectionigraphmachine-learningmetabolic-networksnetwork-analysisnetwork-classificationnetwork-measuresnetworksnetworkxppi-networksrelevant-feature-analysisskewed-datasocial-networkstransportation-networksunbalanced-datasetsweb-networks

SmartNamDevoloper/Telecom_Customer_churn_Classification

This project demonstrates building a classification model for imbalanced data. Feature engineering, feature selection and extensive EDA. Comparing of logistic regression, random forest and ADA Boost models are done before finalizing the best model.

Jupyter Notebook00Updated 4 years ago

adaboostedafeature-engineeringfeature-selectionhandling-missing-valuelogistic-regressionrandom-forestrecallrferoc-auc-curveskewed-data

linguistician/Normalize.jl

Normalization on skewness and kurtosis of a dataset

Julia00Updated 2 years ago

juliajulia-languagejulia-packagejulialangjupyterjupyter-notebookkurtosisnormalnormal-distributionnormalitynormalizationnormalizeskewed-dataskewness

mervat-khaled/Car-Brand-Classification

This project was completed as part of the CIT 650 "Intro To Big Data" course at Nile University.

Jupyter Notebook00Updated 1 year ago

classificationgradient-boostingimbalanced-classificationmllibpysparkrandom-forestskewed-data