Vorlesungen aus der Schule über Bioinformatik von A bis Z.

Im Sommer 2019 fand zum siebten Mal die Sommerschule für Bioinformatik statt - eine wöchentliche Bildungsintensität für hundert Studenten und Absolventen aus verschiedenen Städten und Ländern, die ihre ersten Schritte in diesem Bereich unternahmen.

Biologen, Ärzte, Programmierer, Mathematiker, Physiker, Chemiker - die häufigsten Fachgebiete der Schüler - sind bedingt in zwei Gruppen von "Biologen" und "Informatikern" unterteilt. Die Vorträge und Praktiken widmeten sich verschiedenen Methoden der Bioinformatik und ihrer Anwendung in Medizin und Biologie: von der Evolution über die Analyse von Einzelzellsequenzierungsdaten bis hin zum Altern.

Nachfolgend teilen wir die Übersicht, Videos und Folien von 15 vergangenen Vorträgen. Mit einem Sternchen "*" gekennzeichnet kann ohne Vorbereitung oder mit Grundkenntnissen angezeigt werden.

Genieße das Zusehen!



1. * Einführung in NGS Technologies | Barbitov Yuri, Institut für Bioinformatik

Video | Folien

Yuri sprach über die grundlegenden Methoden der Next Generation Sequencing (NGS) und die Mechanismen, die der Datenerfassung zugrunde liegen. Die Geschichte erklärt den Wirkungsmechanismus der Polymerasekettenreaktion (PCR), die Senger-Sequenzierung und den Unterschied zwischen verschiedenen Sequenzierungstechnologien der zweiten und dritten Generation. Separat werden experimentelle Ansätze angegeben, die es ermöglichen, verschiedene Arten von Daten zu erhalten.



2. * Bioinformatik-Tricks zur Analyse antiker DNA | Tatyana Tatarinova, Universität La Verne

Video | Folien

Alte DNA zieht die Aufmerksamkeit von Wissenschaftlern als Datenquelle für Arten und Organismen auf sich, die derzeit nicht mehr leben. Aufgrund der schlechten Konservierung der DNA ist die Methode der bioinformatischen Datenverarbeitung jedoch unterschiedlich und erfordert eine große Anzahl von Tricks. Tatyana spricht über solche Ansätze am Beispiel der alten DNA aus den Überresten der Khazar.



3. Sequenzierung und Analyse von Krebsgenomen Sergey Aganezov, Johns Hopkins University

Video | Folien

Somatische Mutationen während der Krebsentstehung können den Karyotyp des Genoms in den Zellen stark verändern und ihnen einen Populationsvorteil verschaffen, der zu einer unkontrollierten Proliferation des bösartigen Tumors führt. Die Analyse struktureller genetischer Veränderungen in den Zellen solcher Tumoren spielt eine wichtige Rolle bei der Untersuchung der Ursachen und des Verständnisses der Krebsentstehung.

Die Vorlesung zeigt, wie Methoden und Kenntnisse aus den Bereichen Graphentheorie, Kombinatorik und lineare Programmierung verwendet werden können, um ein genaueres und informativeres Bild von strukturellen Veränderungen im Genom von Krebszellen zu erhalten.

Sergey sprach über algorithmische Ansätze zur Wiederherstellung umgelagerter genomischer Karyotypen in Gruppen von Krebszellen in sequenzierten heterogenen malignen Tumoren. Er untersuchte auch die Schwierigkeiten, die nicht-haploide Genome von gesunden Zellen und Krebszellen verursachen, und beschrieb Modelle für die Arbeit mit der Sequenzierung heterogener Krebsarten.



4. * "Nicht-ätherische" Bemühungen des Geistes: Warum Mathematik und Programmierung in der Biomedizin gefragt sind | Pjotr ​​Wlassow, Institut für Wissenschaft und Technologie

Video | Folien

In der modernen Biologie, Medizin und Pharmakologie tauchen zunehmend Forschungs- und angewandte Aufgaben auf, die fundierte Kenntnisse der Physik und Mathematik sowie der IT-Technologien erfordern.

Warum hat der starke Anstieg des Volumens experimenteller und theoretischer Daten das bio / medizinische Gebiet näher an das Gebiet der Mathematik und IT gebracht? Wie genau wird die Synergie von mathematisch / programmatischen Ansätzen und einem tiefen Verständnis der Biologie auf die moderne Entwicklung von Arzneimitteln und personalisierter Biomedizin "projiziert"? In den letzten Jahren haben wir es geschafft zu verstehen, was in der Schlüssel-Genotyp-Phänotyp-Beziehung für die Biomedizin neu ist, einschließlich im Kontext einer Vielzahl von Krankheiten? Wie zeigt dieses Verständnis neue „Ziele“ für die Therapie? Und warum sind in solchen Studien gute Kenntnisse in Mathematik und Programmierung gefragt?

In seinem Vortrag diskutierte Peter diese und andere Themen unter Verwendung spezifischer Ressourcen und Werkzeuge zur Analyse biomedizinischer Daten sowie einiger grundlegender Forschungsprobleme.



5. * Bearbeitung des menschlichen Genoms auf Embryo-Ebene | Denis Rebrikov, Russische Nationale Medizinische Forschungsuniversität, benannt nach Pirogov

Video | Folien

Das CRISPR-Genom-Editiersystem ermöglicht gezielte Änderungen der Nukleotidsequenz von DNA. Der Vortragende sprach darüber, wie mit Hilfe dieser Technik eine mögliche Bearbeitung menschlicher Embryonen im Zygotenstadium möglich ist, welche Gefahren und Risiken bestehen und wie sie die Sicherheit des Ansatzes bewerten. Denis gab auch einen Überblick über die Klontechnologien und wissenschaftlichen Ansätze, die diesen Prozessen zugrunde liegen.



6. Warum sind B-Zellen so unterschiedlich? | Ilaria Tarasova, Walter und Eliza Hall Institut für medizinische Forschung

Video | Folien

Wie kann man aktivierte Lymphozyten mit einem Transkript transkribieren, um zu verstehen, welche Gene von der Zeit und von der Anzahl der Teilungen abhängen? Was sind die Unterschiede zwischen B-Zellen und warum so viele Funktionstypen im Körper? Die Antworten auf diese und andere Fragen gibt Ilaria in seinem Vortrag.



7. * Schneid- und Nähkurse: Wie werden Designerproteine ​​in der Medizin und Biotechnologie eingesetzt? Anton Chugunov, IBCh RAS, Biomolekül

Video | Folien

Anton erzählte, welche Ansätze es gibt, um Proteine ​​mit den gewünschten Eigenschaften gezielt zu modifizieren und sogar „von Grund auf neu“ zu gestalten. Dies sind jedoch neue Medikamente und Moleküle für die Biotechnologie und sogar neue Möglichkeiten im Energiesektor.



8. Epigenetische Regulation und Alterung Oleg Shpinov, JetBrains Forschung

Video| Slides

Aging ist der komplexe Prozess, dem lebende Organismen ausgesetzt sind. In der Vorlesung untersuchte Oleg die Grundprinzipien der epigenetischen Regulation sowie experimentelle und rechnerische Methoden für die Datenverarbeitung, einschließlich einer umfassenden ChIP-Seq-Datenanalyselösung - JBR Genome Browser und SPAN Semisupervised Peak ANalyzer .

In der Vorlesung werden auch Methylierungsstunden erwähnt, eine Methode zur Vorhersage des biologischen Alters anhand der chemischen Modifikationen eines DNA-Moleküls. Das Publikum schließt mit einer Geschichte über die Untersuchung des menschlichen Epigenoms in Entwicklung und Alterung, die von der Washington University in St. Louis und dem JetBrains Research Laboratory durchgeführt wird.



9. * Einführung in das maschinelle Lernen Grigory Sapunov, Intento

Video| Folien

Maschinelles Lernen als Feld der künstlichen Intelligenz zieht weiterhin die Aufmerksamkeit der Forscher auf sich. Wir können sagen, dass dies eine Alternative zur Programmierung ist, mit deren Hilfe Muster in Daten identifiziert werden können, die für das normale Auge nicht sichtbar sind. Der Dozent informiert ausführlich über jede Phase der Modellschulung und die Bedeutung der Qualität der Daten, die für die Eingabe bereitgestellt werden.



10. RNA-seq-Datenanalyse | Alexey Sergushichev, ITMO University

Video | Mit den

RNA-Sequenzierungsdaten (RNA-seq) können Sie die Änderung der Genpoolexpression in Geweben oder ganzen Organismen bewerten. Alexey sprach über Protokolle und RNA-Sequenzierung im Allgemeinen, Quantifizierung und Ansätze zur Analyse der differentiellen Genexpression.



11. * Algorithmen zum Aufbau des Genoms | Andrey Przhibelsky, SPbSU TsAB

Video | Folien

Die Genomassemblierung ist ein komplexer algorithmischer Berechnungsprozess. Andrei sprach über Montagealgorithmen basierend auf Graph de Bruyne und Metriken, die bei der Montage wichtig sind.



12. Suche nach seltenen pathogenen Allelen mit großer Wirkung in der finnischen Bevölkerung | Wassili Ramenski, Staatliche Haushaltsanstalt Nationales Medizinisches Forschungszentrum für Präventivmedizin des russischen Gesundheitsministeriums

Video | Folien

Es wird angenommen, dass seltene genomische Varianten das Risiko der Entwicklung häufiger Krankheiten und die Bedeutung quantitativer phänotypischer Merkmale stark beeinflussen. Trotz der technologischen Entwicklung fehlt der modernen Forschung immer noch eine ausreichende Anzahl von Proben, um solche Optionen zuverlässig zu identifizieren.

In isolierten Populationen, die ein Stadium eines starken Bevölkerungsrückgangs durchlaufen haben, beispielsweise auf Finnisch, können schädliche Allele mit viel höheren Häufigkeiten als in normalen Populationen beobachtet werden. Die Sequenzierung von 78 Genen in 6.000 Finnen zeigte, wie wichtig es ist, große und gut beschriebene Kohorten für die erfolgreiche Suche nach seltenen Varianten zu haben.

Die Sequenzierung von Exomen von 20.000 Einwohnern Nord- und Ostfinnlands ergab 43 neue Assoziationen schädlicher Varianten mit 25 Zeichen. Die meisten der nachgewiesenen neuen schädlichen Allele kommen bei Finnen vor, deren Häufigkeit 10-100-mal höher ist als in anderen europäischen Populationen. Um solche Optionen in anderen europäischen Bevölkerungsgruppen zu identifizieren, wären Stichproben von Hunderttausenden oder sogar Millionen von Personen erforderlich.

Vasily sprach über die grundlegende Möglichkeit, seltene klinisch signifikante Varianten durch Sequenzierung ausreichend großer Kohorten zu erkennen, und über die Wirksamkeit der Verwendung isolierter Populationen zur Lösung eines solchen Problems.



13. * Suche nach Biomarkern aus Proteomen und anderen Expressionsdaten mit maschinellen Lernmethoden | Elena Chuklina, ETH Zürich

Video |Folien

Elena sprach über das Konzept der Biomarker und wie und wie gut maschinelles Lernen für ihre Suche funktioniert. Die Vorlesung erwähnt verschiedene Arten des maschinellen Lernens und bietet einen schrittweisen Implementierungsalgorithmus. Elena zeigt anhand von Beispielen, wie dies in der Medizin anhand realer Proteomdaten und der Ergebnisse der Analyse der differentiellen Genexpression verwendet werden kann.



14. * In der Welt der Proteomik | Pavel Sinitsyn, Max-Planck-Institut für Biochemie

Video | Folien

Pavel spricht über verschiedene Prinzipien und Ansätze zur Datenerfassung in der Proteomik. Der Dozent erklärt detailliert jeden Schritt der Datenerfassung, die Peptidauswahlmerkmale und zeigt die Unterschiede in den Ansätzen der Bottom-up- und Top-down-Methoden.



15. Die Untersuchung der Gehirnentwicklung auf der Ebene einzelner Zellen Konstantin Okonechnikov, Deutsches Krebsforschungszentrum

Video | Folien

Konstantin gibt in seinem Vortrag einen detaillierten Überblick über Einzelzellsequenzierungstechnologien und zeigt, wie Einzelzelldaten in der Gehirnforschung verwendet werden können. Separat diskutiert der Dozent Ansätze zur Verarbeitung von Einzelzelldaten.



Schlussendlich


Seit 2013 finden jährlich Sommerschulen statt, und auf dem öffentlich zugänglichen YouTube-Kanal wurden viele Videos aus verschiedenen Jahren mit einer breiten Themenabdeckung gesammelt.

Bis zum 1. Mai sind Bewerbungen für die Sommerschule 2020 möglich, die vom 27. Juli bis 1. August in St. Petersburg stattfinden wird. Für diejenigen, die tieferes Wissen wünschen - bis zum 22. Februar können Sie ein Umschulungsprogramm in Bioinformatik in St. Petersburg und Moskau oder ein Seminar über Systembiologie vor Ort absolvieren .

Die Schule 2019 fand dank der Unterstützung von JetBrains , BIOCAD und EPAM statt , für die sie sehr dankbar sind.

Bioinformatik an alle und bis bald!

PS - Frühere Beiträge zu Habré mit einem Überblick über Vorlesungen zur Bioinformatik: 2018 , 2017 , 2016 .


All Articles