Lexikalische Grammatik

Diese Seite beschreibt die lexikalische Grammatik von JavaScript. Quelltext in JavaScript ist einfach eine Abfolge von Zeichen – damit der Interpreter ihn versteht, muss die Zeichenfolge in eine strukturiertere Darstellung geparst werden. Der initiale Schritt des Parsings wird lexikalische Analyse genannt, bei der der Text von links nach rechts gescannt wird und in eine Abfolge individueller, atomarer Eingabeelemente umgewandelt wird. Einige Eingabeelemente sind für den Interpreter unbedeutend und werden nach diesem Schritt entfernt – dazu gehören Leerzeichen und Kommentare. Die anderen, darunter Identifikatoren, Schlüsselwörter, Literale und Trennzeichen (meistens Operatoren), werden für die weitere Syntaxanalyse verwendet. Zeilenendzeichen und mehrzeilige Kommentare sind ebenfalls syntaktisch unbedeutend, beeinflussen jedoch den Prozess der automatischen Semikolonsetzung, um bestimmte ungültige Token-Sequenzen gültig zu machen.

Formatsteuerungszeichen

Formatsteuerungszeichen haben keine visuelle Darstellung, werden aber verwendet, um die Interpretation des Textes zu steuern.

Codepunkt	Name	Abkürzung	Beschreibung
U+200C	Zero Width Non-Joiner	<ZWNJ>	Wird zwischen Zeichen platziert, um zu verhindern, dass sie in bestimmten Sprachen zu Ligaturen verbunden werden (Wikipedia).
U+200D	Zero Width Joiner	<ZWJ>	Wird zwischen Zeichen platziert, die normalerweise nicht verbunden werden, um sie in bestimmten Sprachen in ihrer verbundenen Form darzustellen (Wikipedia).
U+FEFF	Byte Order Mark	<BOM>