La citosina è una delle cinque basi azotate che sono attaccate a uno zucchero a cinque atomi di carbonio, pentosio e un gruppo fosfato per produrre nucleotidi. I nucleotidi sono le unità che si uniscono per formare molecole di DNA e RNA. Le altre basi, oltre alla citosina, che compongono una molecola di DNA sono adenina, guanina e timina. In una molecola di RNA, l’uracile sostituisce la timina.
Le basi sono divise in due diversi gruppi. Adenina e guanina sono basi puriniche e citosina, timina e uracile sono basi pirimidiniche. I due gruppi differiscono nella loro struttura di base. Le basi puriniche sono costituite da due anelli di atomi, mentre le basi pirimidiniche sono costituite da un solo anello. Le basi sono chiamate basi azotate in quanto gli anelli contengono atomi di azoto e carbonio.
Le basi si accoppiano sempre solo con un’altra base. Le basi puriniche si legano solo alle basi pirimidiniche. Le basi puriniche non si legano mai con altre basi puriniche e le basi pirimidiniche non si legano mai con altre basi pirimidiniche. In particolare, la citosina si accoppia sempre con la guanina e l’adenina si accoppia con la timina o l’uracile, a seconda che si tratti di una molecola di DNA o di RNA. Questo accoppiamento è indicato come accoppiamento di base specifico.
L’accoppiamento specifico delle basi mantiene la molecola molto più uniforme e stabile. Avendo le basi puriniche legate solo alle basi pirimidiniche, la distanza tra i due filamenti di una molecola di DNA sarà uniforme, un doppio anello e un singolo anello. Se una base purinica dovesse legarsi con un’altra base purinica, ci sarebbe un doppio anello legato a un doppio anello. Se una base pirimidinica dovesse legarsi con un’altra base pirimidinica, un singolo anello sarebbe legato a un singolo anello. Se così fosse, la struttura della molecola del DNA non sarebbe uniforme, si piegherebbe dentro e fuori a seconda delle basi accoppiate.
Infine, l’abbinamento specifico è determinato dalla struttura di ciascuna base. La struttura influenza il modo in cui le basi si legano insieme e il numero di legami idrogeno che si formano. Quando la citosina si lega alla guanina, si formano tre legami idrogeno tra le due basi. Quando l’adenina si lega alla timina o all’uracile, si formano solo due legami idrogeno. Solo queste coppie di basi sono in grado di formare i necessari legami idrogeno in una molecola di DNA.
La sequenza di basi lungo una molecola di DNA forma il codice per istruire una cellula a produrre particolari proteine o geni. Le triplette delle basi codificano per specifici amminoacidi, i mattoni delle proteine. La sequenza determina quali amminoacidi devono essere uniti e in quale ordine. Le proteine in una cellula determinano la struttura e la funzione di una cellula, quindi le basi azotate portano il codice genetico per una cellula.