Egor Pytev
kagor4
Data Scientist. Работаю с Python, Pandas, Scikit-learn, SQL. Опыт в digital-маркетинге и автоматизации процессов. Открыт для интересных проектов.
Languages
Repos
19
Stars
1
Forks
0
Top Language
Python
Loading contributions...
Top Repositories
Модель прогнозирования стоимости подержанных автомобилей с RMSE 1611.68 на основе LightGBM. Использованы Python, Scikit-learn, Pandas, LightGBM.
My profile
Модель прогнозирования ухода клиентов для Бета-Банка с F1-мерой 0.61, построенная на RandomForestClassifier с учетом дисбаланса данных. Использованы Python и Scikit-learn.
Модель прогнозирования покупок клиентов интернет-магазина в течение 90 дней с использованием LightGBM. Достигнута высокая точность при сильном дисбалансе классов. Использованы Python, Scikit-learn, LightGBM.
Портфолио Data Science: проекты в ML, нейронных сетях, NLP, Computer Vision, временных рядах и аналитике. Использованы Python, Scikit-learn, PyTorch, TensorFlow, CatBoost, PySpark.
Оценка стоимости квартир в Санкт-Петербурге и области: анализ, обработка аномалий и предсказание цен
Repositories
19Модель прогнозирования стоимости подержанных автомобилей с RMSE 1611.68 на основе LightGBM. Использованы Python, Scikit-learn, Pandas, LightGBM.
My profile
Модель прогнозирования ухода клиентов для Бета-Банка с F1-мерой 0.61, построенная на RandomForestClassifier с учетом дисбаланса данных. Использованы Python и Scikit-learn.
Модель прогнозирования покупок клиентов интернет-магазина в течение 90 дней с использованием LightGBM. Достигнута высокая точность при сильном дисбалансе классов. Использованы Python, Scikit-learn, LightGBM.
Портфолио Data Science: проекты в ML, нейронных сетях, NLP, Computer Vision, временных рядах и аналитике. Использованы Python, Scikit-learn, PyTorch, TensorFlow, CatBoost, PySpark.
Оценка стоимости квартир в Санкт-Петербурге и области: анализ, обработка аномалий и предсказание цен
Модель прогнозирования оттока клиентов телеком-компании с ROC AUC 0.903 на основе CatBoost. Использованы Python, Scikit-learn, CatBoost, SQLite.
Модель прогнозирования ухода клиентов банка с F1 0.61 на основе RandomForest. Использованы Python, Scikit-learn, Pandas, методы борьбы с дисбалансом.
Модель классификации токсичных комментариев с F1 0.7506 на основе CatBoost и TF-IDF. Использованы Python, Scikit-learn, NLTK, SMOTE.
Модель прогнозирования стоимости жилья в Калифорнии с RMSE 68932.66 на основе LinearRegression и PySpark. Использованы Python, Pandas, Scikit-learn.
Прогнозирование прибыли от нефтяных скважин для компании «ГлавРосГосНефть» с использованием линейной регрессии и анализа рисков (Bootstrap). Цель — определить регион с максимальной ожидаемой прибылью и минимальным риском убытков.
Анализ эффективности господдержки российского кинематографа: жанры, студии, сборы и оценки зрителей. Исследование для Минкульта РФ.
Анализ данных сервиса GoFast для оценки подписки Ultra и оптимизации бизнес-модели.
Модель прогнозирования спроса на такси в аэропорту с RMSE 42.57 на основе LinearRegression. Использованы Python, Scikit-learn, Pandas, CatBoost, LightGBM
Модель прогнозирования риска ДТП для каршеринга с F1 0.674 на основе нейронной сети. Использованы Python, PyTorch, CatBoost, PostgreSQL, Streamlit.
Нейросетевая модель для предсказания температуры звёзд с RMSE 4263 на основе PyTorch. Использованы Python, Scikit-learn, Pandas, корреляция Phik.
Модель прогнозирования выживаемости стартапов с F1 0.997 на основе DecisionTree, оптимизированного через Optuna. Использованы Python, Scikit-learn, Optuna.
PoC мультимодального поиска изображений по текстовому описанию для фотохостинга с использованием ResNet50 и BERT. Использованы Python, TensorFlow, SentenceTransformers.
Модель компьютерного зрения для предсказания возраста покупателей супермаркета «Хлеб-Соль» с MAE 7.12, основанная на ResNet50. Использованы Python, TensorFlow, Keras.