std::mblen

ヘッダ `<cstdlib>` で定義
`int mblen( const char* s, std::size_t n );`

s によって最初のバイトが指されているマルチバイト文字のバイト単位のサイズを調べます。

s がヌルポインタの場合は、グローバルな変換状態をリセットし、シフトシーケンスが使用されるかどうかを調べます。

この関数は std::mbtowc の変換状態が影響を受けないことを除いて std::mbtowc((wchar_t*)0, s, n) の呼び出しと同等です。

ノート

mblen を呼ぶたびに、内部のグローバルな変換状態 (この関数のみが使用する std::mbstate_t 型の静的オブジェクト) を更新します。マルチバイトエンコーディングがシフト状態を使用する場合、バックトラッキングや複数回のスキャンを避けるように注意しなければなりません。いずれの場合でも、複数のスレッドが同期せずに mblen を呼ぶべきではありません。代わりに std::mbrlen を使用することができます。

引数

s	-	マルチバイト文字を指すポインタ
n	-	調べることができる s 内のバイト数の制限

戻り値

s がヌルポインタでなければ、そのマルチバイト文字に含まれるバイト数を返します。 s の指す最初のバイト列が有効なマルチバイト文字を形成しない場合は -1、 s がヌル文字 '\0' を指す場合は 0 を返します。

s がヌルポインタであれば、内部の変換状態を初期シフト状態を表すようにリセットし、現在のマルチバイトエンコーディングが状態依存でない (シフトシーケンスを使用しない) 場合は 0、現在のマルチバイトエンコーディングが状態依存 (シフトシーケンスを使用する) の場合は非ゼロの値を返します。

例

Run this code

#include <clocale>
#include <string>
#include <iostream>
#include <cstdlib>
#include <stdexcept>

// the number of characters in a multibyte string is the sum of mblen()'s
// note: the simpler approach is std::mbstowcs(NULL, s.c_str(), s.size())
std::size_t strlen_mb(const std::string& s)
{
    std::size_t result = 0;
    const char* ptr = s.data();
    const char* end = ptr + s.size();
    std::mblen(NULL, 0); // reset the conversion state
    while (ptr < end) {
        int next = std::mblen(ptr, end-ptr);
        if (next == -1) {
            throw std::runtime_error("strlen_mb(): conversion error");
        }
        ptr += next;
        ++result;
    }
    return result;
}

int main()
{
    // allow mblen() to work with UTF-8 multibyte encoding
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    std::string str = u8"z\u00df\u6c34\U0001f34c"; // or u8"zß水🍌"
    std::cout << str << " is " << str.size() << " bytes, but only "
              << strlen_mb(str) << " characters\n";
}

出力:

zß水🍌 is 10 bytes, but only 4 characters

言語
標準ライブラリヘッダ
フリースタンディング処理系とホスト処理系
名前付き要件
言語サポートライブラリ
コンセプトライブラリ (C++20)
診断ライブラリ
ユーティリティライブラリ
文字列ライブラリ
コンテナライブラリ
イテレータライブラリ
範囲ライブラリ (C++20)
アルゴリズムライブラリ
数値演算ライブラリ
ローカライゼーションライブラリ
入出力ライブラリ
ファイルシステムライブラリ (C++17)
正規表現ライブラリ (C++11)
アトミック操作ライブラリ (C++11)
スレッドサポートライブラリ (C++11)
技術仕様書

ヌル終端文字列
バイト文字列
マルチバイト文字列
ワイド文字列
クラス
basic_string
basic_string_view (C++17)
char_traits

mbtowc	次のマルチバイト文字をワイド文字に変換します (関数) [edit]
mbrlen	指定された状態を使用して次のマルチバイト文字のバイト数を返します (関数) [edit]
mblen の C言語リファレンス

cppreference.com

検索

名前空間

変種

表示

操作

std::mblen

目次

ノート

引数

戻り値

例

関連項目

案内

ツール