Viele Westler glauben, dass sich Chinesisch auf eine einzige Sprache bezieht und dass Variationen in der Aussprache dialektischen Unterschieden entsprechen, die bei Englischsprechenden, die in Südstaaten leben, und denen, die in Nordstaaten leben, gefunden werden. Obwohl die Dutzenden von chinesischen Varianten alle die gleichen lexikalischen Elemente und die gleichen grammatikalischen Strukturen verwenden, kann ein Sprecher aus einem Gebiet möglicherweise vollständig nicht in der Lage sein, mit einem Sprecher aus einem anderen Bereich mündlich zu kommunizieren. Dies liegt nicht daran, dass jeder den Akzent des anderen für zu dick hält, sondern weil alle chinesischen Wörter nicht nur aus Phonemen oder Lauteinheiten bestehen, sondern ihre Bedeutung auch durch Töne oder die Tonhöhe, mit der ein Wort ausgesprochen wird, tragen. Transkribierer verwenden eine Tonnummer sowie einen Tonnamen für einen gesprochenen Satz mit einer von mehreren westlichen Transkriptionsmethoden.
Mit über 845 Millionen Sprechern ist Mandarin mit Abstand die am häufigsten verwendete Sprache der Welt. Mandarin enthält wie alle chinesischen Sprachen, die oft als chinesische Dialekte bezeichnet werden, Töne, die die Bedeutung eines Wortes bestimmen. Ton Nummer eins heißt Yin Ping und ist ein gleichmäßiger Ton, der weder ansteigt noch abfällt. Ton Nummer zwei, Yang Ping, fällt in der Mitte des Wortes leicht ab und kehrt dann zur ursprünglichen Tonhöhe zurück. Shang ist der dritte Ton, und auch er fällt ab, aber dramatischer als Yang-Ping, und der vierte und letzte Ton in Mandarin, qu, beginnt an einem Höhepunkt und stürzt ab.
Mandarin und andere chinesische Sprachen sind einsilbig; Da alle Sprachen die Zahl der Phoneme einschränken, ist es notwendig, die Tonhöhe in jedes chinesische Wort zu integrieren, da sonst nicht genügend phonemische Kombinationen vorhanden sind. Englisch ist, wie andere mehrsilbige Sprachen, nicht tonal, aus dem einfachen Grund, dass es nicht notwendig ist. Mit nur 40 Phonemen enthält das englische Lexikon weit über 250,000 Wörter; Dies ist möglich, weil das Englische mehrere Silben zulässt und neue Wörter Wurzeln mit Affixen kombinieren sowie Laute neu anordnen.
In Mandarin ist eine einzelne Silbe ein Wort, und indem dieser Silbe vier Töne gegeben werden, in denen sie verwendet werden kann, werden aus einer Silbe effektiv vier verschiedene Wörter. Dies mag komplex genug sein, um den Verstand vieler Westler zu verblüffen, aber Taiwanesisch, eine andere chinesische Sprache, fügt vier zusätzliche Tonnummern hinzu, also insgesamt acht, und Kantonesisch umfasst neun verschiedene Töne.
Es ist wichtig zu beachten, dass im Gegensatz zu vielen anderen Sprachen nicht alle chinesischen Sprachen oder Dialekte in ihrer Schriftform auf dem Alphabet basieren. Ein Zeichen steht für ein Wort und jedes Wort ist eine einzelne Silbe. Dies bedeutet, dass eine Mandarin-Äußerung, die in Ton Nummer eins, Ton Nummer zwei und Ton Nummer vier ausgesprochen werden kann, mit drei unterschiedlichen und nicht zusammenhängenden Zeichen geschrieben wird. Auf diese Weise können ein kantonesischer und ein taiwanesischer Sprecher denselben Text lesen und vollständig verstehen, ihn jedoch sehr unterschiedlich aussprechen.