Преобразуйте числовые байты в символьное представление Unicode
unicodestr = native2unicode (байты)
unicodestr = native2unicode (байты, кодируя)
unicodestr = native2unicode(bytes)
преобразовывает числовой вектор, bytes
, от пользовательской кодировки по умолчанию до символьного представления Unicode®. native2unicode
обрабатывает bytes
как вектор 8-битных байтов, и каждое значение должно быть в области значений [0,255]. Выходным аргументом unicodestr
является вектор символа, имеющий ту же общую форму массивов как bytes
.
unicodestr = native2unicode(bytes, encoding)
преобразовывает bytes
в представление Unicode учитывая, что bytes
находится в схеме кодировки символов, заданной encoding
. Входной параметр encoding
не должен иметь никаких символов (''
) или он должен быть именем или псевдонимом для схемы кодирования. Некоторыми примерами является 'UTF-8'
, 'latin1'
, 'US-ASCII'
и 'Shift_JIS'
. Если encoding
не задан или не имеет никаких символов (''
), схема кодировки по умолчанию используется. encoding
может быть вектором символа или скаляром строки.
Если bytes
является вектором символа или скаляром строки, он возвращен неизменный.
Этот пример начинается с вектора байтов в неизвестной схеме кодировки символов. Написанный пользователем функциональный detect_encoding
определяет схему кодирования. Если успешный, это возвращает имя схемы кодирования или псевдоним как вектор символа. Если неудачный, это выдает ошибку, представленную объектом MException, ME
. Пример вызывает native2unicode
, чтобы преобразовать байты в представление Unicode:
try enc = detect_encoding(bytes); str = native2unicode(bytes, enc); disp(str); catch ME rethrow(ME); end
Обратите внимание на то, что компьютер должен быть сконфигурирован, чтобы отобразить текст на языке, представленном обнаруженной схемой кодирования для вывода disp(str)
, чтобы быть правильным.