Les paires de bases sont des paires de nucléotides liés par une liaison hydrogène trouvée dans l’ADN et l’ARN. Ce matériel génétique est généralement à double brin, avec une structure qui ressemble à une échelle, et chaque ensemble de paires de bases constituant un seul échelon de l’échelle. Les paires de bases ont un certain nombre de propriétés intéressantes qui en font des sujets d’intérêt, et comprendre comment les paires de bases fonctionnent est important pour de nombreux généticiens.
Les nucléotides qui composent l’ADN sont l’adénine (A), la thymine (T), la cytosine (C) et la guanine (G). Dans l’ARN, la thymine est remplacée par l’uracile (U). Ensemble, ces petits composés chimiques constituent le code génétique d’un organisme, avec leur arrangement codant pour la production d’un certain nombre de protéines. L’adénine ne peut se lier qu’à la thymine et la cystosine ne peut se lier qu’à la guanine. Cela signifie, par exemple, que lorsqu’un brin d’ADN est examiné, s’il y a un A à une extrémité d’un échelon, un T doit être à l’autre.
L’adénine et la guanine sont deux types de molécules appelées purines, tandis que la thymine et la cytosine sont des pyrimidines. Les purines sont plus grosses, avec une structure qui interdit à deux d’entre elles de s’adapter sur un même échelon de l’échelle, tandis que les pyrimidines sont trop petites. Cela signifie que l’adénine ne peut pas devenir une paire de bases avec la guanine et que la thymine ne peut pas être une paire de bases avec la cytosine.
On pourrait raisonnablement se demander pourquoi la purine adénine ne peut pas se lier à la pyrimidine cytosine, et pourquoi la thymine ne peut pas se lier à la guanine. La réponse a à voir avec la structure moléculaire de ces composés ; l’adénine ne peut pas former de liaison hydrogène avec la cytosine, tout comme la thymine ne peut pas former de liaison hydrogène avec la guanine. Ces propriétés dictent l’arrangement fondamental des paires de bases, le composé à une extrémité de l’échelon dictant quel composé se trouvera de l’autre côté.
Il faut de nombreux ensembles de paires de bases pour constituer un seul gène, et n’importe quel brin d’ADN peut contenir de nombreux gènes en plus de sections de ce que l’on appelle l’ADN non codant, un ADN qui ne semble avoir aucune fonction. Le génome humain contient environ trois milliards de paires de bases, ce qui explique pourquoi il a fallu si longtemps pour séquencer avec succès le génome humain, et comprendre l’arrangement des paires de bases n’aide pas les gens à comprendre où se trouvent des gènes spécifiques et ce que font ces gènes. D’une certaine manière, les paires de bases pourraient être considérées comme l’alphabet utilisé pour écrire le livre du code génétique.