UTF-8(8ビット・エレメント、Universal Character Set/Unicode Transformation Format)は、Unicodeに対する可変長文字符号化である。Unicode規格内の任意の文字を表すために使用できます。また、エンコードされた最初のバイトはASCIIに準拠しているため、元のASCII文字を処理していたソフトウェアは、変更を行う必要がないか、または変更を行う必要がない場合にのみ使用できるようになります。そのため、電子メール、Webページ、その他の文字を格納または転送するアプリケーションで優先的に採用される符号化になりつつある