Concepita come soluzione per situazioni in cui applicazioni critiche, come database, server Web e piattaforme di condivisione file, devono essere sempre disponibili, una rete di bilanciamento del carico ha la capacità di scalare le prestazioni in base all’utilizzo del sistema. Lo fa distribuendo il traffico su un numero di cluster di server che compongono il sistema complessivo, noto come host. In genere, le funzionalità di livello aziendale come l’accesso a Internet, i proxy, la rete privata virtuale, lo streaming multimediale e le applicazioni specializzate sono supportate da una rete di bilanciamento del carico. Gli utenti che implementano applicazioni di e-commerce possono trovare valore in una rete di bilanciamento del carico data la sua capacità di appropriarsi dinamicamente delle risorse in relazione alla domanda.
La teoria alla base di una rete di bilanciamento del carico è migliorare le prestazioni distribuendo le richieste degli utenti tra un numero di server, riducendo il carico su ogni singolo server in un dato momento. Inoltre, una rete di bilanciamento del carico in genere ha la capacità di monitorare e compensare i guasti dei dispositivi, riducendo al minimo o eliminando potenziali tempi di inattività in caso di guasto di uno o più server. Il bilanciamento del carico utilizza più copie della stessa applicazione TCP/IP (Transmission Control Protocol/Internet Protocol), ad esempio un server Web o un’applicazione di e-commerce, e le collega a un unico IP primario utilizzando un numero di indirizzi IP virtuali. L’effetto per un utente finale è l’integrazione perfetta e l’aspetto che l’applicazione funziona su un singolo server. A tutti gli effetti, l’applicazione funziona come se fosse anche su un server.
Quando funziona correttamente, una rete di bilanciamento del carico è in grado di interpretare i dati in ingresso ed elaborare richieste discrete contemporaneamente. Ciò significa che elementi diversi dello stesso sito Web possono essere alimentati da diversi cluster, ad esempio. Utilizzando rapporti preimpostati o una distribuzione statistica, una rete di bilanciamento del carico tiene traccia dell’utilizzo del client e risponde instradando dinamicamente le richieste a vari cluster di server. Attraverso ping ripetitivi, i server del cluster comunicano tra loro e sono in grado di compensare in un breve periodo di tempo qualsiasi guasto o disconnessione di un determinato cluster dall’intero. Tipicamente in questi casi, il software del client ritenterà automaticamente la connessione e il ritardo è virtualmente impercettibile.
La gestione di una rete di bilanciamento del carico è in pratica simile alla gestione di qualsiasi altro server. Un amministratore può accedere in remoto a vari cluster da qualsiasi punto all’interno della rete. È possibile esercitare un controllo granulare sui singoli server all’interno di un cluster, sebbene l’algoritmo di bilanciamento del carico possa anche gestire il controllo completo. Gli aggiornamenti del sistema e persino dell’hardware sono generalmente possibili “al volo”, il che può essere vantaggioso nelle applicazioni in cui il tempo di attività è mission-critical.