Si stima che il corpo umano possa contenere oltre due milioni di proteine, codificate da soli 20,000 – 25,000 geni. È probabile che il numero totale trovato negli organismi biologici terran superi i dieci milioni, ma nessuno lo sa per certo. I dati sono disponibili su poco più di un milione di essi, presi principalmente dalle informazioni trovate negli oltre 100 genomi che sono stati completamente sequenziati.
Il campo che analizza le proteine in generale e si propone di caratterizzare in modo esaustivo tutte quelle presenti nel corpo umano si chiama proteomica. Molti vedono il prossimo passo logico dopo il completamento del Progetto Genoma Umano come l’inizio di un Progetto Proteoma Umano. La Human Proteome Organization è stata fondata per perseguire questo obiettivo.
Le proteine sono lunghe catene molecolari costituite dai 20 mattoni fondamentali della vita, gli amminoacidi. La più lunga conosciuta, la titina, nota anche come connectina, contiene 26,926 amminoacidi. La titina si trova nei muscoli e contribuisce alla sua rigidità passiva. Poiché i 20 amminoacidi possono essere collegati in sequenze arbitrarie, lo spazio totale delle possibili proteine è esponenziale, con un valore di circa 2050,000, un numero enorme. All’interno di questo spazio possono esserci cure per ogni malattia o disturbo, ma individuarle in un numero così vasto è una profonda sfida computazionale e teorica.
La parola proteina deriva dal greco prota, che significa “di primaria importanza”. Questo è un nome adatto, poiché la loro importanza centrale nel corpo umano non può essere sopravvalutata. Tutti gli organismi biologici possono essere visti fondamentalmente come strutture proteiche riempite d’acqua e talvolta supportate da tessuti mineralizzati chiamati ossa. Per quasi tutti, ce n’è un altro che può abbatterlo. A volte si uniscono in unità reciprocamente cooperative chiamate complessi, che svolgono utili funzioni biologiche. Ogni sezione di informazioni genetiche utili, che si trova nel DNA e in alcuni RNA, codifica per una proteina corrispondente che va a svolgere un ruolo biologico utile.