Les acides aminés peuvent être liés entre eux pour former des chaînes contenant de deux à plusieurs milliers d’unités. Les chaînes courtes sont appelées peptides, tandis que les chaînes plus longues sont appelées polypeptides, qui comprennent des protéines. Une séquence d’acides aminés est simplement l’ordre de ces unités dans une chaîne polypeptidique. Dans le cas des protéines, la séquence détermine la structure tridimensionnelle de la molécule, qui à son tour est cruciale pour la fonction de la protéine. Les séquences d’acides aminés des protéines présentes dans un organisme vivant sont codées dans l’ADN de cet organisme.
Structure des acides aminés
Les acides aminés ont tous une structure générale constituée d’un atome de carbone avec un groupe amino (NH2) d’un côté, un groupe carboxyle (COOH) de l’autre, et ce qu’on appelle un groupe R, ou chaîne latérale. « R » signifie radical, qui dans ce contexte signifie simplement une partie d’une molécule. C’est la composition de la chaîne latérale qui distingue les différents acides aminés les uns des autres. Dans le plus simple, la glycine, il se compose uniquement d’un atome d’hydrogène, mais dans d’autres, la chaîne latérale est plus complexe. Par exemple, dans la tyrosine, il a une structure cyclique et dans la lysine, il se compose d’une longue chaîne hydrocarbonée – une molécule composée d’un squelette de carbone avec des atomes d’hydrogène attachés.
Comment les séquences se forment
Le groupe amino est basique et a une charge positive, tandis que le groupe carboxyle est acide et porte une charge négative. Étant donné que les acides et les bases réagissent les uns avec les autres, cela permet au groupe amino d’un acide aminé de se lier au groupe carboxyle d’un autre. C’est ce qu’on appelle une liaison peptidique, et elle libère une molécule d’eau en tant que sous-produit. Les processus chimiques comme celui-ci sont connus sous le nom de réactions de condensation, car une partie de chaque molécule a été perdue dans le processus : le H du NH2 et le OH du groupe COOH se combinent pour former de l’eau (H2O). À strictement parler, les unités d’acides aminés qui forment les peptides et les protéines doivent être appelées résidus d’acides aminés, mais elles sont généralement simplement appelées acides aminés.
Descriptions des séquences
Une chaîne de ces unités aura typiquement un groupe amino à une extrémité et un groupe carboxyle à l’autre. Par souci de cohérence, les séquences sont décrites de gauche à droite, avec l’extrémité amino, connue sous le nom de N-terminal, à gauche et l’extrémité carboxyle, ou C-terminale à droite. Cependant, il est également possible que les extrémités opposées d’une chaîne polypeptidique forment une liaison peptidique, résultant en une molécule cyclique.
Les protéines, et d’autres polypeptides, peuvent donc être décrits par la séquence d’unités d’acides aminés. Par souci de concision, les noms des unités sont généralement abrégés en trois lettres ou en une seule lettre. Par exemple, dans le système à trois lettres, l’arginine est Arg, la leucine est Leu et la proline est Pro. Dans le système à une lettre, les lettres de ces unités sont respectivement R, L et P. Par conséquent, une séquence d’acides aminés particulière pourrait être représentée par Leu-Arg-Leu-Pro-Arg-Pro, ou par LRLPRP.
Forme et fonction des protéines
La séquence d’unités dans une protéine est connue comme sa structure primaire. Cependant, des liaisons peuvent également se former entre les chaînes latérales d’une chaîne polypeptidique, la faisant se replier de diverses manières, et entre les chaînes latérales des chaînes polypeptidiques adjacentes. Ces types de liaison contribuent à ce que l’on appelle les structures secondaires, tertiaires et quaternaires des protéines, qui déterminent les formes tridimensionnelles globales des molécules. Les liaisons entre les chaînes latérales sont normalement plus faibles que les liaisons peptidiques, et des facteurs tels que la chaleur et divers agents chimiques peuvent les rompre, provoquant la perte de forme d’une protéine, mais préservant la structure primaire. C’est ce qu’on appelle la dénaturation.
Bien qu’il existe plus de 100 acides aminés connus, seulement une vingtaine se trouvent dans les protéines qui composent les organismes vivants. Néanmoins, ces 20 peuvent former plusieurs milliers de séquences différentes, de longueurs variables. De nombreuses protéines sont constituées de plus d’une chaîne polypeptidique et peuvent former d’énormes molécules d’une complexité énorme.
Protéines, gènes et ADN
L’ADN d’un organisme peut être considéré comme un ensemble d’instructions permettant de rassembler toutes les protéines dont il a besoin. La séquence d’acides aminés nécessaire à chaque protéine est codée dans l’ADN sous la forme de groupes de trois nucléotides appelés codons, dont chacun représente une unité d’acides aminés particulière. Les processus de transcription d’ADN et de traduction d’ARN permettent à ces unités d’être assemblées dans les séquences correctes pour former les protéines nécessaires lorsque les cellules se divisent.
Tout d’abord, l’ADN est transcrit pour former un brin d’ARN messager, ou ARNm. L’ARNm sort du noyau et pénètre dans le cytoplasme de la cellule vers un ribosome, où la traduction a lieu. L’ARNm agit comme une matrice pour les acides aminés, leur permettant de se joindre. Pour chaque codon, l’ARN de transfert, ou ARNt, transporte l’acide aminé libre approprié du cytoplasme vers le ribosome où ils sont joints à la chaîne existante. Au fur et à mesure que l’ARNm est traduit, les unités sont jointes pour former la séquence spécifique de cette protéine.