Es wird geschätzt, dass der menschliche Körper über zwei Millionen Proteine enthalten kann, die von nur 20,000 bis 25,000 Genen kodiert werden. Die Gesamtzahl, die in terranischen biologischen Organismen gefunden wird, wird wahrscheinlich zehn Millionen überschreiten, aber niemand weiß es genau. Zu etwas mehr als einer Million davon sind Daten verfügbar, die hauptsächlich aus Informationen stammen, die in den über 100 vollständig sequenzierten Genomen gefunden wurden.
Das Gebiet, das Proteine im Allgemeinen analysiert und darauf abzielt, alle im menschlichen Körper erschöpfend zu charakterisieren, wird Proteomik genannt. Viele sehen den nächsten logischen Schritt nach Abschluss des Humangenomprojekts in der Initiierung eines Humanproteomprojekts. Um dieses Ziel zu verfolgen, wurde die Human Proteome Organization gegründet.
Proteine sind lange Molekülketten, die aus den 20 Grundbausteinen des Lebens, den Aminosäuren, bestehen. Das am längsten bekannte Titin, auch als Connectin bekannt, enthält 26,926 Aminosäuren. Titin kommt im Muskel vor und trägt zu seiner passiven Steifheit bei. Da sich die 20 Aminosäuren in beliebiger Reihenfolge aneinanderreihen lassen, ist der Gesamtraum der möglichen Proteine exponentiell mit einem Wert von etwa 2050,000 – eine enorme Zahl. Innerhalb dieses Raumes mag es Heilmittel für jede Krankheit oder jedes Leiden geben, aber sie in einer so großen Zahl zu finden, ist eine tiefgreifende rechnerische und theoretische Herausforderung.
Das Wort Protein stammt aus dem Griechischen prota und bedeutet „von vorrangiger Bedeutung“. Dies ist ein passender Name, da ihre zentrale Bedeutung im menschlichen Körper nicht hoch genug eingeschätzt werden kann. Alle biologischen Organismen können grundsätzlich als mit Wasser gefüllte Proteinstrukturen angesehen werden, die manchmal von mineralisierten Geweben, den Knochen genannt, getragen werden. Für fast jeden gibt es einen anderen, der es abbauen kann. Sie verschmelzen manchmal zu wechselseitig kooperativen Einheiten, die als Komplexe bezeichnet werden und nützliche biologische Funktionen erfüllen. Jeder Abschnitt nützlicher genetischer Informationen, der in DNA und einigen RNAs zu finden ist, kodiert für ein entsprechendes Protein, das dann eine nützliche biologische Rolle erfüllt.