On estime que le corps humain peut contenir plus de deux millions de protéines, codées par seulement 20,000 25,000 à 100 XNUMX gènes. Le nombre total trouvé dans les organismes biologiques terrans est susceptible de dépasser les dix millions, mais personne ne le sait avec certitude. Des données sont disponibles sur un peu plus d’un million d’entre eux, tirées principalement des informations trouvées dans plus de XNUMX génomes qui ont été entièrement séquencés.
Le domaine qui analyse les protéines en général et vise à caractériser de manière exhaustive toutes celles du corps humain s’appelle la protéomique. Beaucoup voient la prochaine étape logique après l’achèvement du projet du génome humain être le lancement d’un projet de protéome humain. La Human Proteome Organization a été fondée pour poursuivre cet objectif.
Les protéines sont de longues chaînes moléculaires constituées des 20 éléments de base de la vie, les acides aminés. La plus ancienne connue, la titine, également connue sous le nom de connectine, contient 26,926 20 acides aminés. La titine se trouve dans le muscle et contribue à sa raideur passive. Parce que les 2050,000 acides aminés peuvent être connectés dans des séquences arbitraires, l’espace total des protéines possibles est exponentiel, avec une valeur d’environ XNUMX – un nombre énorme. Dans cet espace, il peut y avoir des remèdes pour chaque maladie ou affection, mais les localiser dans un si grand nombre est un défi informatique et théorique profond.
Le mot protéine vient du grec prota, qui signifie de première importance. C’est un nom approprié, car leur importance centrale dans le corps humain ne peut pas être surestimée. Tous les organismes biologiques peuvent être vus fondamentalement comme des structures protéiques remplies d’eau et parfois soutenues par des tissus minéralisés appelés os. Pour presque tout le monde, il y en a un autre qui peut le briser. Ils fusionnent parfois en unités mutuellement coopératives appelées complexes, qui remplissent des fonctions biologiques utiles. Chaque section d’information génétique utile, trouvée dans l’ADN et certains ARN, code pour une protéine correspondante qui remplit un rôle biologique utile.