( persicsb | 2015. 10. 05., h – 14:57 )

A webszervered azt mondja a Content-type headerben, hogy a tartalom, amit a böngésző kapni fog, az HTML, és UTF-8 kódolással kell értelmezni a tartalmát:
Content-Type:text/html;charset=UTF-8

Miközben a tartalom az nem értelmezhető UTF-8-ként, pont a kérdéses rész bytesorozata invalid UTF-8 bytesorozat.

Lehetne ez Content-Type:text/html;charset=iso-8859-2 is, de akkor sem lenne jó a file URL-je, mert invalid UTF-8 bytesorozat van benne percent-encode-olva.

Lásd a szabványt: https://tools.ietf.org/html/rfc2046#page-7
Ez leírja, hogy a Text MIME-típusnak hogyan lehet megadni a charset paramétert, és a default az US-ASCII.
Mondjuk az eléggé zavaró, hogy keverik a karakterkészlet és karakterkódolás fogalmakat ebben a szabványban (meg sok máshol), hiszen UTF-8 esetén a karakterkészlet az Unicode, a karakterkódolás az UTF-8. Bár eleve sokszor baj, hogy sokan nem tudják, mi a különbség karakterkészlet és karakterkódolás között.