Преобразуйте числовые байты в представление символа Юникода
unicodestr = native2unicode(bytes)
unicodestr = native2unicode(bytes,
encoding)
unicodestr = native2unicode(bytes)
преобразует числовой вектор, bytes
, от кодировки по умолчанию пользователя до Юникода® представление символов. native2unicode
лечит bytes
как вектор 8-битных байтов, и каждое значение должно находиться в области значений [0,255]. Выходной аргумент unicodestr
- вектор символов, имеющий ту же общую форму массива, что и bytes
.
unicodestr = native2unicode(bytes,
encoding)
преобразует bytes
в представление Юникода с предположением, что bytes
находится в схеме символа кодирования, заданной encoding
. Входной параметр encoding
не должно иметь символов (''
) или это должно быть имя или псевдоним для схемы кодирования. Некоторые примеры 'UTF-8'
, 'latin1'
, 'US-ASCII'
, и 'Shift_JIS'
. Если encoding
не задан или не имеет символов (''
), используется схема кодирования по умолчанию. encoding
может быть вектором символов или строковым скаляром.
Примечание
Если bytes
- вектор символов или строковый скаляр, он возвращается без изменений.
Этот пример начинается с вектора байтов в неизвестной схеме кодирования символов. Пользовательская функция detect_encoding
определяет схему кодирования. В случае успеха он возвращает имя схемы кодирования или псевдоним в виде вектора символов. Если это не удалось, это выдает ошибку, представленную объектом MException, ME
. Пример вызывает native2unicode
для преобразования байтов в представление Юникода:
try enc = detect_encoding(bytes); str = native2unicode(bytes, enc); disp(str); catch ME rethrow(ME); end
Обратите внимание, что компьютер должен быть сконфигурирован для отображения текста на языке, представленном обнаруженной схемой кодирования для выхода disp(str)
быть правильным.