GitHunt

Egor Pytev

kagor4

Data Scientist. Работаю с Python, Pandas, Scikit-learn, SQL. Опыт в digital-маркетинге и автоматизации процессов. Открыт для интересных проектов.

Lipetsk, Russia

Languages

Python82%Jupyter Notebook18%

Repos

19

Stars

1

Forks

0

Top Language

Python

Loading contributions...

Top Repositories

Repositories

19
KA
kagor4/Used-Car-Price-Predictor

Модель прогнозирования стоимости подержанных автомобилей с RMSE 1611.68 на основе LightGBM. Использованы Python, Scikit-learn, Pandas, LightGBM.

Python10Updated 9 months ago
automotivecar-price-predictiondata-sciencefeature-engineeringjobliblightgbmmachine-learningmatplotlibnumpypandaspythonregressionscikit-learnseaborntqdm
KA
kagor4/kagor4

My profile

00Updated 9 months ago
KA
kagor4/Churn-Prediction-for-Beta-Bank

Модель прогнозирования ухода клиентов для Бета-Банка с F1-мерой 0.61, построенная на RandomForestClassifier с учетом дисбаланса данных. Использованы Python и Scikit-learn.

Jupyter Notebook00Updated 9 months ago
bankingchurn-predictionclassificationdata-sciencedecision-treesf1-scoreimbalanced-datalogistic-regressionmachine-learningpredictive-modelingpythonrandom-forestscikit-learnupsampling
KA
kagor4/Purchase-Prediction-for-Online-Store

Модель прогнозирования покупок клиентов интернет-магазина в течение 90 дней с использованием LightGBM. Достигнута высокая точность при сильном дисбалансе классов. Использованы Python, Scikit-learn, LightGBM.

Jupyter Notebook00Updated 9 months ago
big-dataclassificationdata-sciencefeature-engineeringimbalanced-datak-neighborslightgbmlogistic-regressionmachine-learningmarketingpredictive-modelingpurchase-predictionpythonrandom-forestscikit-learn
KA
kagor4/DataSciencePortfolio

Портфолио Data Science: проекты в ML, нейронных сетях, NLP, Computer Vision, временных рядах и аналитике. Использованы Python, Scikit-learn, PyTorch, TensorFlow, CatBoost, PySpark.

00Updated 9 months ago
analyticsbig-datacatboostclassificationcomputer-visiondata-sciencefeature-engineeringlightgbmmachine-learningnerual-networknlppysparkpythonpytorchregressionscikit-learntime-series
KA
kagor4/Real-Estate-Price-Predictor

Оценка стоимости квартир в Санкт-Петербурге и области: анализ, обработка аномалий и предсказание цен

Python00Updated 9 months ago
anomaly-detectiondata-sciencefeature-engineeringjupyter-notebookmatplotlibnumpypandasprice-predictionpythonreal-estateregressionscikit-learnseaborn
KA
kagor4/project_telecom

Модель прогнозирования оттока клиентов телеком-компании с ROC AUC 0.903 на основе CatBoost. Использованы Python, Scikit-learn, CatBoost, SQLite.

Python00Updated 9 months ago
catboostchurn-predictionclassificationdata-scienceimbalanced-datamachine-learningmatplotlibnumpypandasplotlypythonpytorchscikit-learnseabornsqlitetelecommunications
KA
kagor4/bank_churn_project

Модель прогнозирования ухода клиентов банка с F1 0.61 на основе RandomForest. Использованы Python, Scikit-learn, Pandas, методы борьбы с дисбалансом.

Python00Updated 9 months ago
churn-predictionclassificationdata-sciencefeature-engineeringimbalanced-datamachine-learningmatplotlibnumpypandaspythonrandom-forestscikit-learntqdm
KA
kagor4/toxic_comments_project

Модель классификации токсичных комментариев с F1 0.7506 на основе CatBoost и TF-IDF. Использованы Python, Scikit-learn, NLTK, SMOTE.

Python00Updated 9 months ago
catboostdata-sciencefeature-engineeringimbalanced-learnmachine-learningmatplotlibnlpnltknumpypandaspymystem3pythonscikit-learnseaborntext-classificationtext-processingtfidftoxic-comments
KA
kagor4/California-Housing-Price-Predictor

Модель прогнозирования стоимости жилья в Калифорнии с RMSE 68932.66 на основе LinearRegression и PySpark. Использованы Python, Pandas, Scikit-learn.

Python00Updated 9 months ago
catboostdata-sciencedemand-forecastingfeature-engineeringlightgbmlinear-regressionmachine-learningmatplotlibnumpypandaspythonscikit-learnseabornstatsmodelstime-seriestransportation
KA
kagor4/OilWell-Profit-Predictor

Прогнозирование прибыли от нефтяных скважин для компании «ГлавРосГосНефть» с использованием линейной регрессии и анализа рисков (Bootstrap). Цель — определить регион с максимальной ожидаемой прибылью и минимальным риском убытков.

Python00Updated 9 months ago
bootstrapdata-sciencejupyter-notebooklinear-regressionmachine-learningnumpyoil-industrypandasprofit-predictionpythonregression-analysisrisk-assessmentscikit-learn
KA
kagor4/Russian-Film-Industry-Analytics

Анализ эффективности господдержки российского кинематографа: жанры, студии, сборы и оценки зрителей. Исследование для Минкульта РФ.

Python00Updated 9 months ago
cinema-analyticsdata-analysisexploratory-data-analysisjupyter-notebookmatplotlibpandaspublic-fundingrussian-movies
KA
kagor4/GoFast-Scooter-Analytics

Анализ данных сервиса GoFast для оценки подписки Ultra и оптимизации бизнес-модели.

Python00Updated 9 months ago
business-insightsdata-analysisedajupyter-notebookmatplotlibpandaspythonscooterstatisticssubscriptions
KA
kagor4/Taxi-Demand-Prediction

Модель прогнозирования спроса на такси в аэропорту с RMSE 42.57 на основе LinearRegression. Использованы Python, Scikit-learn, Pandas, CatBoost, LightGBM

Python00Updated 9 months ago
catboostdata-sciencedemand-forecastingfeature-engineeringlightgbmlinear-regressionmachine-learningmatplotlibnumpypandaspythonscikit-learnseabornstatsmodelstime-seriestransportation
KA
kagor4/Accident-Risk-Prediction-System

Модель прогнозирования риска ДТП для каршеринга с F1 0.674 на основе нейронной сети. Использованы Python, PyTorch, CatBoost, PostgreSQL, Streamlit.

Python00Updated 9 months ago
accident-predictioncarsharingcatboostclassificationdata-sciencefeature-engineeringmachine-learningmatplotlibneural-networknumpypandasphikpostgresqlpsycopg2pythonscikit-learnseabornstreamlit
KA
kagor4/Star-Temperature-Predictor

Нейросетевая модель для предсказания температуры звёзд с RMSE 4263 на основе PyTorch. Использованы Python, Scikit-learn, Pandas, корреляция Phik.

Python00Updated 9 months ago
astrophysicsdata-sciencefeature-engineeringmachine-learningmatplotlibneural-networknumpypandasphikpythonpytorchregressionscikit-learnseabornstar-temperature
KA
kagor4/Startup-Survival-Predictor

Модель прогнозирования выживаемости стартапов с F1 0.997 на основе DecisionTree, оптимизированного через Optuna. Использованы Python, Scikit-learn, Optuna.

Python00Updated 9 months ago
business-analyticsclassificationdata-sciencedecision-treesfeature-engineeringkagglemachine-learningmatplotliboptunapandasphikpythonscikit-learnseabornstartup-prediction
KA
kagor4/photohosting_project

PoC мультимодального поиска изображений по текстовому описанию для фотохостинга с использованием ResNet50 и BERT. Использованы Python, TensorFlow, SentenceTransformers.

Python00Updated 9 months ago
bertcomputer-visiondata-sciencekeraskeras-nlpmachine-learningmatplotlibmultimodal-searchnlpnltknumpypandaspillowpythonresnet50scikit-learnseabornsentence-transformerstensorflowtqdm
KA
kagor4/Khleb-Sol_supermarket_project

Модель компьютерного зрения для предсказания возраста покупателей супермаркета «Хлеб-Соль» с MAE 7.12, основанная на ResNet50. Использованы Python, TensorFlow, Keras.

Jupyter Notebook00Updated 9 months ago
age-predictioncomputer-visiondata-sciencedeep-learningimbalanced-datakerasmachine-learningmatplotlibnumpypandaspythonresnet50retailseaborntensorflow

Gists

Recent Activity

Egor Pytev (kagor4) | GitHunt