RIP-Seq – Angeln in der Zelle

Vorwort

In ein paar unserer Blog-Posts wollen wir komplexe Methoden der modernen Biologie so beschreiben, dass sie auch für Laien verständlich sind. Die Methoden werden in verschiedenen Projekten des Forschungskonsortiums SPP2141 angewendet, die wir hier verlinken werden (Link folgt).

Die erste Methode, die wir vorstellen, ist RIP-Seq. Das steht für „RNA Immuno-Precipitation and Sequencing“. Mit RIP-Seq kann man z.B. alle RNAs, die an ein Cas-Protein gebunden sind (crRNA, tracrRNA und andere) aus einer Zelle angeln und identifizieren. Die Methode findet aber auch in vielen anderen Projekten Verwendung. Es gibt in einer Zelle sehr viele RNPs (RNA-Protein-Komplexe) mit unterschiedlichsten Funktionen, die man so analysieren kann.

Der Angelhaken

Als „Angelhaken“ dient ein Antikörper, der in diesem Fall das Cas-Protein als „Fisch“ erkennt und bindet. Die Herstellung von Antikörpern gegen ein spezifisches Protein ist aufwändig. Einfacher ist es, ein „Tag“, eine Markierung, an das Cas-Gen in der Zelle anzubauen. Das „Tag“ ist eine kurze DNA-Sequenz, die für ein kurzes Stück eines anderen Proteins codiert. Das „getaggte“ Cas-Gen wird in die Zellen eingebracht und ersetzt das normale Cas-Gen. Das „Tag“ wird mit dem Gen in RNA überschrieben und dann zusammen mit der Cas-Sequenz in Protein übersetzt. Das Cas-Enzym ist damit ein kleines Stück größer geworden, funktioniert aber in den meisten Fällen einwandfrei.
Es gibt etliche solcher „Tags“, die von Wissenschaftlern weltweit für verschiedene Zwecke benutzt werden. Man kann also unterschiedliche Proteine für verschiedene Experimente relativ einfach mit dem gleichen „Tag“ versehen. Dann gibt es Antikörper, die gegen dieses „Tag“ gerichtet sind und fest daran binden. Einige Firmen stellen diese Antikörper in großen Mengen her, koppeln sie an verschiedene „Handgriffe“ für verschiedene Zwecke und verkaufen sie. Das erspart den Wissenschaftlern viel Zeit, Geld und Arbeit! Mit einem gekauften Antikörper kann man, in unterschiedlichen Experimenten, zehn oder mehr verschiedene Proteine (mit dem selben „Tag“) „angeln“.

Wie geht man nun vor?

Die Zellen mit dem „getaggten“ Cas-Protein werden aufgeschlossen (lysiert), dabei muss man vorsichtig vorgehen, damit die Komplexe aus RNA und Protein nicht zerfallen. Oft werden die Komplexe noch durch Zugabe von Chemikalien stabilisiert.

Das sogenannte Zell-Lysat enthält sämtliche Bestandteile der Zelle aus denen wir nur die Cas-Proteine und ihre anhängenden RNAs herausangeln wollen. Eine Möglichkeit ist es, Antikörper gegen das Tag zuzugeben, die als „Handgriff“ an ein winziges magnetischen Metallkügelchen gekoppelt sind. Die Antikörper binden an die Cas-Proteine und können zusammen mit dem „Fisch“, ganz einfach mit einem Magneten aus dem Lysat gezogen werde.

Nun hat man in einem Reagenzglas alle Cas-Proteine, alle anhängenden RNAs, die Antikörper und die magnetischen Kügelchen – aber sonst nichts. Alle anderen Zellbestandteile bleiben nicht an dem Magneten hängen und werden verworfen. Die Proteine, einschließlich der Antikörper kann man abbauen und zerstören, die Magnetkügelchen fallen ab, die RNA bleibt intakt und in Lösung. Es folgen noch ein paar Reinigungsschritte, bei denen man meistens mit „leeren“ Reagenzgläsern arbeitet – die Menge an RNA ist so gering, dass man sie nicht sehen kann. Die RNA wird dann in eine Hochdurchsatz-Sequenziermaschine gesteckt. Das ist wieder ein komplizierter Vorgang, den wir vielleicht an anderer Stelle noch beschreiben werden. Einige werden vielleicht wissen, dass man RNA nicht so einfach sequenzieren kann – sie muss in einem weiteren Schritt in DNA umgeschrieben werden. Aber dann kann’s losgehen!

1. Zelle mit den verschiedensten Zellbestandteilen, darunter das Cas-Protein (gelb) mit dem Tag (rot) und verschiedenen RNAs (hellblau) .
2. Die Zelle wird lysiert, die Zellbestandteile fließen aus.
3. In einem Reagenzglas werden zu den Zellbestandteilen Antikörper (rot) mit einem Metallkügelchen (blau) zugegeben. Die Antikörper binden spezifisch an den Cas-Komplex.
4. Die Antikörper mit den anhängenden Komplexen werden von einem Magneten festgehalten, der Rest wird abgegossen und verworfen.
5. Zu der Mischung aus Antikörpern, Cas-Protein und RNA wird eine Enzymlösung gegeben, mit der alle Proteine (Cas-Protein und Antikörper) zerstört werden.
6. Alle verbleibende RNA wird (nach einem weiteren Zwischenschritt) in einer Sequenziermaschine sequenziert.
7. Die Daten der Sequenziermaschine werden im Computer analysiert und sortiert.

Die Datenanalyse

Die heutigen Sequenziermaschinen können ein paar Millionen DNA-Moleküle parallel analysieren – das ist weitgehend automatisiert. Herausfordernd ist eher die bioinformatische Analyse der Unmenge an Daten, die bei einem Experiment erzeugt werden! Auch da gibt es Programme, die die Arbeit erleichtern – aber gerade in der Grundlagenforschung ist jede Fragestellung anders, die Programme müssen von Bioinformatikern entsprechend angepasst oder neu entwickelt werden.

Beachte auch, dass es nicht mit einer Sequenzierung getan ist! Es sind meist mehrere Proben und dazu kommen mehrere Kontrollen. Und natürlich muss das Ganze mindestens ein- oder zweimal wiederholt werden um experimentelle Fehler ausschließen zu können! Das ist dann wirklich „Big Data“ mit vielen Millionen DNA Sequenzen!

Was dann in einer Grafik einfach und unspektakulär aussieht, hat einen gigantischen Datenhintergrund!

Das Bild zeigt ein RIP-Seq Experiment, das mit CRISPR-Cas nichts zu tun hat. Es wurde ein ganz anderes Protein mit den gebundenen RNAs geangelt. Die Datenanalyse ist jedoch dieselbe wie in dem beschriebenen CRISPR-Cas Experiment.
Nach dem RIP-Seq Experiment werden alle „reads“ (sequenzierte RNA Stücke) dem passenden Ort im Genom zugeordnet. Das Bild zeigt in A einen winzigen Ausschnitt des Genoms eines Einzellers. Das Genom hat eine Größe von 34 Millionen Nukleotiden, gezeigt ist der Abschnitt zwischen Position 2.366.820 und 2.366.900, also über nur 80 Nukleotide. Dort findet man zwischen Position 2.366.862 und Position 2.366.884 knapp 2.000 RNAs, die an ein bestimmtes Protein gebunden hatten. Die DNA Sequenz ist darunter angegeben. In B sind ein paar dieser „reads“ exemplarisch als lineare RNA Stücke gezeigt. Das die nicht alle exakt die gleiche Länge haben, hat technische Gründe. Wenn man davon 2.000 Stück übereinander stapelt entsteht ein Block wie in C. Solche Blocks sieht man auch in dem Artikel (Link folgt).

Wenn solche und ähnliche Experimente aus der Grundlagenforschung z.B. Einzug in die medizinische Routine nehmen, ist das experimentelle Vorgehen weitgehend standardisiert und automatisiert, die ganze Bioinformatik bleibt für das Personal meist verborgen. Die Analytik ist so programmiert, dass sie oft nur ja/nein Antworten gibt und bei Unsicherheiten ein Bioinformatiker hinzugezogen werden muss.

Autor: W. Nellen, BioWissKomm
Titelbild: BioWissKomm by Midjourney
Abb. Flow-Chart RIP-Seq: © BioWissKomm
Abb. Datenanalyse: © BioWissKomm, Teil A aus Promotionsarbeit Sara Müller (2011)