UTF32

Unicode строковое представление UTF-32

    Описание

    32-битный Формат преобразования Unicode (UTF-32) является кодовой точкой Unicode фиксированной длины, кодирующей, который использует точно 32 бита за кодовую точку.

    Создание

    Описание

    пример

    str32 = textanalytics.unicode.UTF32(str) возвращает Unicode представление UTF-32 str. Если str массив, затем str32(i) Unicode представление UTF-32 строки str(i).

    Входные параметры

    развернуть все

    Введите текст в виде массива строк, вектора символов или массива ячеек из символьных векторов.

    Пример: ["An example of a short sentence."; "A second short sentence."]

    Типы данных: string | char | cell

    Свойства

    развернуть все

    Кодовые точки UTF-32 в виде вектора из целых чисел с типом uint32.

    Если входная строка содержит суррогатные пары, то соответствующий список кодовых точек имеет различную длину.

    Типы данных: uint32

    Функции объекта

    characterCategoriesКатегории символа Unicode
    hexПреобразуйте представление UTF-32 шестнадцатеричным значениям
    stringПреобразуйте представление UTF-32 строке

    Примеры

    свернуть все

    Преобразуйте строку "Hello! " к его Unicode строковое представление UTF-32 с помощью textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразуйте строку "Hello! " к его Unicode строковое представление UTF-32 с помощью textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Получите категории символа Unicode str32 использование characterCategories функция.

    ucats = characterCategories(str32)
    ucats = 1x1 cell array
        {[L    L    L    L    L    P    Z    S]}
    
    

    Категории символа Unicode "L", "P", "Z", и "S" соответствуют "букве", "пунктуации", "диафрагме" и "символу", соответственно.

    Преобразуйте строку "Hello! " к его Unicode строковое представление UTF-32 с помощью textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Получите категории символа Unicode str32 использование characterCategories функция. Чтобы возвратить подробные категории символа Unicode, установите 'Granularity' опция к 'detailed'.

    ucats = characterCategories(str32,'Granularity','detailed')
    ucats = 1x1 cell array
        {[Lu    Ll    Ll    Ll    Ll    Po    Zs    So]}
    
    

    Категории символа Unicode "Лютеций", "Ll", "По", "Zs", и "Тем самым" соответствуют "прописной букве", "строчной букве", "другая пунктуация", "диафрагма пробела", и "другой символ", соответственно.

    Преобразуйте строку "Hello! " к его Unicode строковое представление UTF-32 с помощью textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразуйте str32 к шестнадцатеричным значениям с помощью hex функция.

    hexStr = hex(str32)
    hexStr = 
    " 0048  0065  006C  006C  006F  0021  0020 1F600"
    

    Преобразуйте строку "Hello! " к его Unicode строковое представление UTF-32 с помощью textanalytics.unicode.UTF32 функция.

    str = "Hello! ";
    str32 = textanalytics.unicode.UTF32(str)
    str32 = 
      UTF32 with properties:
    
        Data: [72 101 108 108 111 33 32 128512]
    
    

    Преобразуйте str32 представлять использование в виде строки string функция.

    str = string(str32)
    str = 
    "Hello! "
    

    Ссылки

    [1] Приложение № 19 UTF-32 Стандарта Unicode https://www.unicode.org/reports/tr19/tr19-9.html

    Введенный в R2021a