<aside>
🖐🏻 Привет!) Я хемоинформатик с 4-летним опытом в ML и drug design. Стремлюсь применить свой опыт в новых проектах и продолжить профессиональное развитие. Буду рад стать частью вашей команды!
</aside>
<aside>
🔗
Контакты
📧 Email
🔗 Telegram
🐙 GitHub
💼 LinkedIn
</aside>
Технологический стек
- ML и Deep Learning: Python, Pandas, NumPy, Polars, scikit-learn, XGBoost, CatBoost, PyTorch, PyTorch Geometric (PyG), Hugging Face Transformers, NLTK, spaCy
- MLOps и CI/CD: Docker, Airflow, Dagster, ClearML, W&B, DVC, CI/CD, SLURM
- Хемоинформатика: RDKit, Datamol, Open Drug Discovery Toolkit (ODDT), AutoDock Vina, GROMACS, LAMMPS, ORCA, ACE
- Биоинформатика: BioPython, MMseqs2, PyMOL, BLAST, Clustal Omega, AlphaFold, Rosetta, TM-align.
- Системы и DevOps: Git, Bash, Linux, SQL, Dask, asyncio, Joblib
Опыт работы
Ведущий Хемоинформатик
**LigandPro** – (2023 - Настоящее время)
Отвечаю за полный цикл разработки и поддержки ML/хемоинформатических пайплайнов — от генерации данных до автоматизации для drug design:
- Создаю модели, объединяющие молекулярные графы (PyTorch, PyG, NetworkX, RDKit) и текстовые данные (spaCy, LLM), чтобы учитывать все особенности молекул в предсказательных инструментах drug design.
- Разрабатываю ML/DL модели на базе PyTorch, PyG и Transformers для анализа взаимодействий молекул и белков. Оптимизирую пайплайны для EDA и докинга, совершенствуя архитектуры предсказаний.
- Настраиваю CI/CD, деплой и тестирование моделей (Docker, Dagster, W&B), обеспечиваю стабильность и контроль пайплайна.
- Классический drug design: Проектирую терапевтические молекулы с использованием методов компьютерного дизайна лекарств (CADD), докинга и молекулярной динамики, что ускоряет процесс разработки новых лекарственных соединений.
Основные достижения:
- Создал автоматизированный пайплайн для обработки данных из PDB (Protein Data Bank), увеличив размер датасета вдвое по сравнению с PDBbind+, что значительно повысило качество предсказаний моделей.
- Придумал и внедрил методику генерации синтетических лиганд-белковых комплексов, которые заметно повышают точность предобучения нейросетей для докинга и задач в drug design. (Python, Pandas, NumPy, RDKit, BioPython).
Участие в жизни команды:
- Вел работу тимлида: онбордил людей, проводил code review, планировал задачи, проводил демо для бизнеса, участвовал в собеседованиях.