Семен Стешин “Lo-Hi: Practical ML Drug Discovery Benchmark”
🚀 @SBERLOGABIO webinar on bioinformatics:
👨🔬 Семен Стешин “Lo-Hi: Practical ML Drug Discovery Benchmark”
⌚️ Четверг 19 Октября, (Moscow time)
ML модели сложно сравнить по качеству между собой. Особенно сложно сравнивать молекулярные модели, в которых проверка одного предсказания может стоить несколько тысяч долларов и занимает несколько месяцев.
Семен расскажет про свою новую работу с NeurIPS 2023 “Lo-Hi: Practical ML Drug Discovery Benchmark” в которой он рассматривает две задачи — Hit Identification и Lead Optimization — и сравнивает ML модели для предсказания молекулярных свойств. Он расскажет как разделять датасеты с помощью линейного программирования, чтобы избежать утечек теста, и расскажет про простую библиотеку для сплитинга.
Вы узнаете:
- Работает ли ML в химии или он просто заучивает трейн.
- Умеет ли ML различать небольшие модификации молекул.
- Какие модели лучше подходят для поиска новых молекул. Какие лучше подходят для оптимизации (это разные модели).
- Почему существующие бенчмарки не позволяют выбрать модели для реальных задач.
- Где граница между модификацией существующего лекарства и по-настоящему новой молекулой.
Приглашаются все причастные к разработке лекарств и все фрустрированные утечками теста в биохимическом ML. Доклад ~30 минут.
Тред в Твиттере:
Статья:
Библиотека: