Пространства имён
Варианты
Действия

std::c16rtomb

Материал из cppreference.com
 
 
 
Многобайтовые строки с завершающим нулём
Широкие/многобайтовые преобразования
Типы
 
<tbody> </tbody>
Определено в заголовочном файле <cuchar>
std::size_t c16rtomb( char* s, char16_t c16, std::mbstate_t* ps );
(начиная с C++11)

Преобразует одну кодовую точку из 16-битного представления символов переменной длины (обычно UTF-16) в узкое многобайтовое представление символов.

Если s не является нулевым указателем, а c16 это последняя 16-битная кодовая единица в допустимой кодировке переменной длины кодовой точки, функция определяет количество байтов, необходимых для сохранения представления многобайтового символа этой кодовой точки (включая все последовательности сдвига и принимая во внимание текущее состояние многобайтового преобразования *ps) и сохраняет представление многобайтового символа в массиве символов, на первый элемент которого указывает s, обновляя *ps по мере необходимости. Эта функция может записать не более MB_CUR_MAX байт.

Если s является нулевым указателем, вызов эквивалентен вызову std::c16rtomb(buf, u'\0', ps) для некоторого внутреннего буфера buf.

Если c16 не является последней кодовой единицей в 16-битном представлении широкого символа, он не записывает в массив, на который указывает s, только обновляется *ps.

Если c16 является нулевым широким символом u'\0', сохраняется нулевой байт, которому предшествует любая последовательность сдвига, необходимая для восстановления исходного состояния сдвига, и обновляется параметр состояния преобразования *ps для представления начального состояния сдвига.

Многобайтовая кодировка, используемая этой функцией, определяется текущей активной локалью C.

Параметры

s указатель на массив узких символов, в котором будет храниться многобайтовый символ
c16 16-битный символ для преобразования
ps указатель на объект состояния преобразования, используемый при интерпретации многобайтовой строки

Возвращаемое значение

В случае успеха возвращает количество байтов (включая любые последовательности сдвигов), записанных в массив символов, на первый элемент которого указывает s. Это значение может быть 0, например при обработке первого char16_t в суррогатной паре.

В случае неудачи (если c16 не является допустимым 16-битным символом) возвращает -1, сохраняет EILSEQ в errno и оставляет *ps в неопределённом состоянии.

Примечание

Стандарт C++ отсылает к стандарту C для семантики этой функции. В опубликованном C11, в отличие от std::mbrtoc16, который преобразует многобайтовую кодировку переменной ширины (например, UTF-8) в 16-битную кодировку переменной ширины (например, UTF-16), эта функция может преобразовать только одноединичную 16-битную кодировку, что означает, что она не может преобразовать UTF-16 в UTF-8, несмотря на то, что это было первоначальным намерением этой функции. Это было исправлено в пост C11 отчёте о дефектах DR488.

Пример

Примечание. В этом примере предполагается, что исправление отчёта о дефекте 488 применено.

#include <climits>
#include <clocale>
#include <cuchar>
#include <iomanip>
#include <iostream>
#include <string_view>

int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    std::u16string_view strv = u"zß水🍌"; // or z\u00df\u6c34\U0001F34C
    std::cout << "Обработка " << strv.size() << " кодовых единиц UTF-16: [ ";
    for (char16_t c : strv)
        std::cout << std::showbase << std::hex << static_cast<int>(c) << ' ';
    std::cout << "]\n";

    std::mbstate_t state{};
    char out[MB_LEN_MAX]{};
    for (char16_t c : strv)
    {   
        std::size_t rc = std::c16rtomb(out, c, &state);
        std::cout << static_cast<int>(c) << " преобразовано в [ ";
        if (rc != (std::size_t) - 1)
            for (unsigned char c8 : std::string_view{out, rc})
                std::cout << +c8 << ' ';
        std::cout << "]\n";
    }
}

Вывод:

Обработка 5 кодовых единиц UTF-16: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c ]
0x7a преобразовано в [ 0x7a ]
0xdf преобразовано в [ 0xc3 0x9f ]
0x6c34 преобразовано в [ 0xe6 0xb0 0xb4 ]
0xd83c преобразовано в [ ]
0xdf4c преобразовано в [ 0xf0 0x9f 0x8d 0x8c ]

Смотрите также

(C++11)
преобразует узкий многобайтовый символ в кодировку UTF-16
(функция) [править]
[virtual]
преобразует строку из internT в externT, например, при записи в файл
Оригинал:
converts a string from internT to externT, such as when writing to file
Текст был переведён автоматически используя Переводчик Google.
Вы можете проверить и исправить перевод. Для инструкций щёлкните сюда.

(virtual protected std::codecvt функция-элемент) [править]