Un carattere Unicode® è l’informazione grafica richiesta per visualizzare i caratteri presenti nel set di caratteri universale Unicode® (UCS). Ci sono più di 1 milione di caratteri nell’UCS, ciascuno chiamato punto di codice, e vengono continuamente rivisti ed espansi. Per questo motivo, molti caratteri Unicode® scelgono di fornire solo dati grafici per un sottoinsieme dei caratteri che potrebbero essere rappresentati, come solo lettere e numeri dell’inglese occidentale, sebbene ci siano alcuni caratteri che tentano di fornire informazioni di visualizzazione per tanti caratteri quanti sono possibile. In definitiva, la connessione tra un carattere Unicode® e l’UCS è gestita dal software che utilizza i caratteri, perché non esiste una definizione reale di come dovrebbero comportarsi i caratteri a livello di programmazione.
L’uso di un carattere Unicode® implica la consegna dei due elementi che compongono un carattere completo. Il primo è l’UCS, che è una definizione di quali caratteri mappano su quali numeri specifici. Ciò significa che, nell’UCS, il numero 1 inglese sarebbe rappresentato nell’insieme da un numero indice specifico. Questo numero può quindi essere utilizzato per determinare l’indice nel carattere tipografico per trovare i dati grafici in modo che il carattere possa essere riprodotto su uno schermo o stampato su carta. Gli standard Unicode® si occupano solo dell’UCS sottostante e non dei caratteri tipografici o dell’implementazione della relazione tra i due, quindi questo può variare da programma a programma.
Le informazioni all’interno di un carattere Unicode® possono essere quasi tutto ciò che in qualche modo svolge il ruolo di visualizzare o rappresentare il carattere UCS. La rappresentazione grafica di un carattere UCS è nota come glifo. I glifi in un carattere tipografico possono essere immagini o dati vettoriali in modo che i caratteri possano essere disegnati e ridimensionati a qualsiasi dimensione necessaria. Non esiste una definizione di come debba essere implementato il carattere Unicode®, quindi potrebbe anche contenere informazioni per rendere le lettere in tre dimensioni (3D) o persino firme audio invece di dati visivi.
Esistono alcuni metodi tipici per implementare caratteri complessi in un carattere Unicode®, specialmente nelle lingue non occidentali in cui possono essere presenti decine di migliaia di caratteri individuali. Un modo è fornire informazioni su come compilare un singolo glifo da diversi elementi che potrebbero essere utilizzati ciascuno in più di un carattere. Ciò può consentire a un carattere tipografico di contenere dati grafici meno ripetitivi e sostituirlo con un sistema di stratificazione per creare le immagini uniche necessarie.