UTF32

Юникод UTF-32 строковое представление

    Описание

    32-битный формат преобразования Юникода (UTF-32) является кодировкой кодовой точки Юникода фиксированной длины, которая использует в точности 32 бита на кодовую точку.

    Создание

    Описание

    пример

    str32 = textanalytics.unicode.UTF32(str) возвращает представление UTF-32 Юникода str. Если str является массивом, тогда str32(i) - представление строки в UTF-32 Юникода str(i).

    Входные параметры

    расширить все

    Вход текст, заданный как строковые массивы, вектор символов или массив ячеек векторов символов.

    Пример: ["An example of a short sentence."; "A second short sentence."]

    Типы данных: string | char | cell

    Свойства

    расширить все

    UTF-32 кодовые точки, заданные как вектор из целых чисел с типом uint32.

    Если вход строка содержит суррогатные пары, то соответствующий список кода точек имеет другую длину.

    Типы данных: uint32

    Функции объекта

    characterCategoriesКатегории символов Юникод
    hexПреобразуйте UTF-32 представление в шестнадцатеричные значения
    stringПреобразуйте UTF-32 представление в строковое

    Примеры

    свернуть все

    Преобразуйте строку "Hello! " в свое представление строк UTF-32 в Юникоде с использованием textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразуйте строку "Hello! " в свое представление строк UTF-32 в Юникоде с использованием textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Получите категории символов Юникода str32 использование characterCategories функция.

    ucats = characterCategories(str32)
    ucats = 1x1 cell array
        {[L    L    L    L    L    P    Z    S]}
    
    

    Категории символов Юникод «L», «P», «Z» и «S» соответствуют «букве», «пунктуации», «разделителю» и «символу» соответственно.

    Преобразуйте строку "Hello! " в свое представление строк UTF-32 в Юникоде с использованием textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Получите категории символов Юникода str32 использование characterCategories функция. Чтобы вернуть подробные категории символов Юникода, установите 'Granularity' опция для 'detailed'.

    ucats = characterCategories(str32,'Granularity','detailed')
    ucats = 1x1 cell array
        {[Lu    Ll    Ll    Ll    Ll    Po    Zs    So]}
    
    

    Категории символов Юникод «Lu», «Ll», «Po», «Zs» и «So» соответствуют «заглавным буквам», «строчным буквам», «другим пунктуациям», «пробелам диафрагмы» и «другим символам» соответственно.

    Преобразуйте строку "Hello! " в свое представление строк UTF-32 в Юникоде с использованием textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразование str32 в шестнадцатеричные значения с помощью hex функция.

    hexStr = hex(str32)
    hexStr = 
    " 0048  0065  006C  006C  006F  0021  0020 1F600"
    

    Преобразуйте строку "Hello! " в свое представление строк UTF-32 в Юникоде с использованием textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразование str32 в строку с использованием string функция.

    str = string(str32)
    str = 
    "Hello! "
    

    Ссылки

    [1] Стандартное приложение Unicode # 19 UTF-32 https://www.unicode.org/reports/tr19/tr19-9.html

    Введенный в R2021a