Популяционная генетика человека
Участники изучат генетическое разнообразие человеческих популяций, анализируя данные о SNP (однонуклеотидных полиморфизмах) и структурных вариациях. Задача — выявить закономерности миграций, адаптаций или изоляции, используя инструменты вроде PLINK или ADMIXTURE. Результаты помогут понять эволюционную историю и генетические особенности разных групп.
Поиск биогенных аминов
в геномах бактерий
Биогенные амины (гистамин, тирамин) могут вызывать отравления и аллергии. Участники разработают пайплайн на Nextflow для поиска генов их синтеза (напр., hdc, tdc) в бактериальных геномах, используя базы данных (KEGG, UniProt). Анализ поможет оценить риски в пищевой промышленности.
Генетика мультифакторных заболеваний
Проект посвящен анализу генетических и средовых факторов, влияющих на болезни вроде диабета или гипертонии. Участники применят GWAS (полногеномный поиск ассоциаций) и методы машинного обучения для выявления ключевых генов-кандидатов и создания моделей оценки рисков. Цель — приблизиться к персонализированной профилактике и терапии.
Если у вас есть свои собственные данные, идея для исследования или просто вопрос, на который давно хотелось ответить, вы можете предложить свой проект и поработать над ним в компании единомышленников с поддержкой наших кураторов!
BYOP (Bring Your Own Project)
Ваша собственная идея проекта
Анализ геномных данных дрожжей после модификаций
Проект включает обработку данных RNA-seq или WGS дрожжей, подвергнутых CRISPR-редактированию. Участники оценят эффективность внесенных изменений, выявят off-target эффекты и отклонения в метаболических путях, используя инструменты вроде DESeq2 или IGV. Результаты важны для биотехнологии и синтетической биологии.
Аннотация организмов с нестандартными геномами
Работа с организмами, у которых необычная организация генома (множество плазмид, горизонтальный перенос). Участники аннотируют гены, предскажут функции через InterPro, Prokka и сравнят с известными таксонами. Задача — адаптировать подходы для сложных случаев, например, архей или симбионтов.
Инжиниринг экспрессии в E. coli
Цель — предсказать «горячие» (высокая экспрессия) и «холодные» (низкая) локусы для интеграции чужеродных генов. Участники проанализируют открытые данные (напр., RNA-seq, ChIP-seq), создав модель, и проверят её на экспериментальных данных из статей. Пайплайн упростит разработку штаммов для синтеза белков.