После инженерного проекта по автоматическому расчёту инсоляции помещений(степень освещенности помещений солнечным светом), основанного на методах линейной алгебры, я всерьёз увлекся математикой, что в конечном итоге привело меня в МФТИ и к сфере анализа данных и машинного обучения. Хочу развиваться Data Science и ML-инжиниринга, сосредотачиваясь на прикладных задачах. Также рассматриваю возможность поступления в аспирантуру и участия в исследовательских проектах.
Образование
2024 — по настоящее время
МФТИ, ФПМИ — Магистратура
Факультет: Прикладная математика и информатика
Направление: Современная комбинаторика
2018 — 2022
Тюменский индустриальный университет — Бакалавриат
Направление: Строительство (Расчеты строительных конструкций)
Профессиональный опыт
BIM-Менеджер | ООО «Партнер.Проект»
02/2023 — по настоящее время
- Внедрение и сопровождение информационных технологий в проектной организации
- Разработка систем автоматизации проектирования для поддержки и ускорения рабочих процессов
- Сбор данных с информационной модели по запросу аналитиков, с последующей выгрузкой в PostgreSQL
- Координация работы всех смежных отделов (около 40 человек)
- Обучение сотрудников, создание обучающих материалов и техническая поддержка
- Сбор аналитики с информационных моделей и плагинов
MorseNet — Декодер аудио файлов с кодом Морзе
Цель: построить модель декодирования сигналов морзе, используя технологии, похожие на обработку естественного языка.
Технологии: PyTorch, FastAPI, MLflow, Docker
Описание:
- Построена модель CNN → LSTM с CTC Loss для декодирования из аудиофайлов
- Использованы Mel-спектрограммы и аугментации (time/freq masking)
- Логирование метрик обучения через MLflow
- Сохранение моделей на сервере
- Качество: 0.433 по Levenshtein distance на Kaggle (15 место, лидер — 0.24)
- FastAPI-сервер с возможностью дообучения модели независимо от инференса
- Решение упаковано в Docker
GitHub: Morse-Decoder
Классификация изображений
Цель: построить модель для классификации 42 персонажей по JPEG-изображениям
Технологии: PyTorch, torchvision, seaborn
Описание:
- Разработана CNN-модель с 3 сверточными блоками
- Использовались техники аугментации и расширения тестовой выборки: повороты, изменение яркости, горизонтальное отражение
- 96.56% accuracy на тренировочной выборке для базовой модели
GitHub: Image classification
Предсказание личности
Цель: Разработать модель предсказания личности человека на основе данных.
Технологии: Pandas, Numpy, Matplotlib, Seaborn, StratifiedKFold, CatBoostClassifier, scikit-learn
Описание:
- Проанализирована степень важности пропусков в данных
- Созданы новые признаки для расширения выборки
- Протестированы различные модели - CatBoost, XGBoost, RamdomForest, а так же их стейкинг
GitHub: Personality Prediction
RAG-LMM помощник инженера (в разработке)
Цель: разработать систему умного поиска по внутренней базе знаний компании с выводом найденной информации в качестве контекста LLM.
Технологии: модели компьютерного зрения, ORC, LLM, RAG
Описание:
- Решение проблем с неструктурированной документацией с помощью ORC
- Интеграция примечаний с изображениями в систему
- Проверка актуальности норм
- Фильтрация галлюцинаций LLM
Центр "Пуск" МФТИ:
Продвинутые методы машинного обучения.Кафедра интеллектуальных систем:
Введение в машинное обучение (Константин Воронцов)
Программирование на Python (Мурат Апишев)