Это действительно модифицированный UTF-8?

UTF-8 - это относительно простой способ кодирования кодовых точек Unicode в формате переменной ширины, так что он не может легко перепутать код, не поддерживающий Unicode. Обзор UTF-8 Байты в диапазоне 1-0x7F включительно, как правило, действительны Байты с битовой комбинацией 10XX XXXXсчитаются...