UTF-8 (8-Bit, Universal Character Set/Unicode Transformation Format) ist eine Zeichencodierung mit variabler Länge für Unicode. Es kann verwendet werden, um jedes Zeichen im Unicode-Standard zu repräsentieren, und das erste Byte seiner Codierung ist immer noch ASCII-kompatibel, so dass die ursprüngliche Software, die ASCII-Zeichen verarbeitet, ohne oder nur mit geringen Änderungen weiterverwendet werden kann. Daher wird es allmählich zu der bevorzugten Codierung in E-Mails, Webseiten und anderen Anwendungen, die Texte speichern oder senden.