После инженерного проекта по автоматическому расчёту инсоляции помещений(степень освещенности помещений солнечным светом), основанного на методах линейной алгебры, я всерьёз увлекся математикой, что в конечном итоге привело меня в МФТИ и к сфере анализа данных и машинного обучения. Хочу развиваться Data Science и ML-инжиниринга, сосредотачиваясь на прикладных задачах. Также рассматриваю возможность поступления в аспирантуру и участия в исследовательских проектах.

Образование

2024 — по настоящее время

МФТИ, ФПМИ — Магистратура

Факультет: Прикладная математика и информатика

Направление: Современная комбинаторика

2018 — 2022

Тюменский индустриальный университет — Бакалавриат

Направление: Строительство (Расчеты строительных конструкций)

Профессиональный опыт

BIM-Менеджер | ООО «Партнер.Проект»

02/2023 — по настоящее время

  • Внедрение и сопровождение информационных технологий в проектной организации
  • Разработка систем автоматизации проектирования для поддержки и ускорения рабочих процессов
  • Сбор данных с информационной модели по запросу аналитиков, с последующей выгрузкой в PostgreSQL
  • Координация работы всех смежных отделов (около 40 человек)
  • Обучение сотрудников, создание обучающих материалов и техническая поддержка
  • Сбор аналитики с информационных моделей и плагинов

MorseNet — Декодер аудио файлов с кодом Морзе

Цель: построить модель декодирования сигналов морзе, используя технологии, похожие на обработку естественного языка.

Технологии: PyTorch, FastAPI, MLflow, Docker

Описание:

  • Построена модель CNN → LSTM с CTC Loss для декодирования из аудиофайлов
  • Использованы Mel-спектрограммы и аугментации (time/freq masking)
  • Логирование метрик обучения через MLflow
  • Сохранение моделей на сервере
  • Качество: 0.433 по Levenshtein distance на Kaggle (15 место, лидер — 0.24)
  • FastAPI-сервер с возможностью дообучения модели независимо от инференса
  • Решение упаковано в Docker

Классификация изображений

Цель: построить модель для классификации 42 персонажей по JPEG-изображениям

Технологии: PyTorch, torchvision, seaborn

Описание:

  • Разработана CNN-модель с 3 сверточными блоками
  • Использовались техники аугментации и расширения тестовой выборки: повороты, изменение яркости, горизонтальное отражение
  • 96.56% accuracy на тренировочной выборке для базовой модели

Предсказание личности

Цель: Разработать модель предсказания личности человека на основе данных.

Технологии: Pandas, Numpy, Matplotlib, Seaborn, StratifiedKFold, CatBoostClassifier, scikit-learn

Описание:

  • Проанализирована степень важности пропусков в данных
  • Созданы новые признаки для расширения выборки
  • Протестированы различные модели - CatBoost, XGBoost, RamdomForest, а так же их стейкинг

RAG-LMM помощник инженера (в разработке)

Цель: разработать систему умного поиска по внутренней базе знаний компании с выводом найденной информации в качестве контекста LLM.

Технологии: модели компьютерного зрения, ORC, LLM, RAG

Описание:

  • Решение проблем с неструктурированной документацией с помощью ORC
  • Интеграция примечаний с изображениями в систему
  • Проверка актуальности норм
  • Фильтрация галлюцинаций LLM
  • Центр "Пуск" МФТИ:

    Продвинутые методы машинного обучения.
  • Кафедра интеллектуальных систем:

    Введение в машинное обучение (Константин Воронцов)

    Программирование на Python (Мурат Апишев)