Cytosin ist eine von fünf stickstoffhaltigen Basen, die an eine Zucker-, Pentose- und Phosphatgruppe mit fünf Kohlenstoffatomen gebunden sind, um Nukleotide herzustellen. Nukleotide sind die Einheiten, die sich zu DNA- und RNA-Molekülen verbinden. Die anderen Basen neben Cytosin, aus denen ein DNA-Molekül besteht, sind Adenin, Guanin und Thymin. In einem RNA-Molekül ersetzt Uracil Thymin.
Die Basen sind in zwei verschiedene Gruppen unterteilt. Adenin und Guanin sind Purinbasen und Cytosin, Thymin und Uracil sind Pyrimidinbasen. Die beiden Gruppen unterscheiden sich in ihrer Grundstruktur. Purinbasen bestehen aus zwei Atomringen, während Pyrimidinbasen nur aus einem Ring bestehen. Die Basen werden Stickstoffbasen genannt, da die Ringe Stickstoff- und Kohlenstoffatome enthalten.
Die Basen paaren sich immer nur mit einer anderen Base. Purinbasen verbinden sich nur mit Pyrimidinbasen. Purinbasen binden nie an andere Purinbasen und Pyrimidinbasen binden nie an andere Pyrimidinbasen. Konkret paart sich Cytosin immer mit Guanin und Adenin immer mit Thymin oder Uracil, je nachdem, ob in einem DNA- oder RNA-Molekül. Diese Paarung wird als spezifische Basenpaarung bezeichnet.
Spezifische Basenpaarung hält das Molekül viel einheitlicher und stabiler. Dadurch, dass Purinbasen nur mit Pyrimidinbasen binden, ist der Abstand zwischen den beiden Strängen eines DNA-Moleküls einheitlich, ein Doppelring und ein Einzelring. Wenn eine Purinbase mit einer anderen Purinbase binden würde, wäre ein Doppelring an einen Doppelring gebunden. Wenn eine Pyrimidinbase mit einer anderen Pyrimidinbase binden würde, wäre ein einzelner Ring an einen einzelnen Ring gebunden. Wenn dies der Fall wäre, wäre die Struktur des DNA-Moleküls nicht einheitlich, es würde sich je nach Basenpaarung ein- und ausbiegen.
Schließlich wird die spezifische Paarung durch die Struktur jeder Base bestimmt. Die Struktur beeinflusst, wie gut die Basen miteinander verbunden sind und wie viele Wasserstoffbrücken gebildet werden. Wenn Cytosin mit Guanin bindet, bilden sich zwischen den beiden Basen drei Wasserstoffbrücken. Wenn Adenin mit Thymin oder Uracil bindet, werden nur zwei Wasserstoffbrücken gebildet. Nur diese Basenpaare sind in der Lage, die erforderlichen Wasserstoffbrücken in einem DNA-Molekül zu bilden.
Die Basensequenz entlang eines DNA-Moleküls bildet den Code, der eine Zelle anweist, bestimmte Proteine oder Gene herzustellen. Tripletts der Basen kodieren für bestimmte Aminosäuren, die Bausteine von Proteinen. Die Reihenfolge bestimmt, welche Aminosäuren in welcher Reihenfolge zusammengefügt werden sollen. Proteine in einer Zelle bestimmen die Struktur und Funktion einer Zelle, daher tragen die stickstoffhaltigen Basen den genetischen Code für eine Zelle.