专栏名称: CPP开发者

伯乐在线旗下账号，「CPP开发者」专注分享 C/C++ 开发相关的技术文章和工具资源。

Reflection for C++26

CPP开发者 · 公众号 · · 2024-03-25 08:39

正文

C++23 工作殆尽，C++26 紧随其后，Relection 也有了一些新进展，本篇来看这些更新的些许内容。

新的变化

与上次内容相比，本次更新并没有显著变化。

我觉得最大的变化在于实现上的新进展。之前使用的是 lock3 的反射版本，但那个已数年不曾更新，不支持最新的反射语法。而本次 EDG(Edison Design Group) 基于 P2996 对最新的反射提供了支持，新的语法已然生效。EDG 就是 Daveed Vandevoorde 所在的公司，他是主要技术领导之一，该公司专门研发编译器相关的技术。

因此新的提案提供了许多反射的使用示例，在应用方面更加全面。

尽管如此，EDG 的反射版本并不像 lock3 那样，支持并驾齐驱的几个元编程特性，例如 Expansion statements 和 Soure code injection，它只是在反射特性上有了更新的实现。虽然也有平替方式，但是功能上要弱化许多，而且不甚方便。

基础内容本篇不再赘述，请阅读 C++ 反射第四章标准，本篇接下来将介绍大量实践内容。

新的环境

新的 EDG Experimental Reflection 可以直接在 https://godbolt.org/z/beT7ao7h1 使用，以下的所有示例也全部基于该版本实现。

默认使用 C++23，头文件只需要包含 #include ，所有元函数都在 std::meta 下面。

下面是一个最简单的例子：

1#include 
2
3int main() {
4    constexpr auto r = ^int;
5    typename[:r:] x = 42;       // Same as: int x = 42;
6    typename[:^char:] c = '*';  // Same as: char c = '*';
7}

这里展示了 reflection 和 splicing 操作，在 lock3 版本时，囿于实现，没能使用这种最新的反射语法，而如今已经可以使用，所以 EDG Reflection 使用起来反而比 lock3 简单。

下面看更多使用例子，都是提案中的，由于例子已经很多，额外补充的不在本篇讲。

Selecting Members

这是一个操纵成员的小例子：

 1struct S { unsigned i:2, j:6; };
 2
 3consteval auto member_number(int n) {
 4  if (n == 0) return ^S::i;
 5  else if (n == 1) return ^S::j;
 6}
 7
 8int main() {
 9  S s{0, 0




    
};
10  s.[:member_number(1):] = 42;  // Same as: s.j = 42;
11  s.[:member_number(5):] = 0;   // Error (member_number(5) is not a constant).
12}

通过 lifting(reflection) operator 先返回反射类型 meta::info ，再通过 splicing 重新得到成员类型，从而访问成员。

List of Types to List of Sizes

类型列表转换为类型大小列表：

 1constexpr std::array types = {^int, ^float, ^double};
 2
 3// the consteval is required here because consteval propagation (P2564) is not yet implemented
 4constexpr std::array sizes = []() consteval {
 5  std::array<std::size_t, types.size()> r;
 6  std::transform(types.begin(), types.end(), r.begin(), std::meta::size_of);
 7  return r;
 8}();
 9
10static_assert(sizes[0] == sizeof(int));
11static_assert(sizes[1] == sizeof(float));
12static_assert(sizes[2] == sizeof(double));

这个例子同样很简单，不多讲，最终 sizes 的内容就相当于：

1std::array<std::size_t, 3> sizes = {sizeof(int), sizeof(float), sizeof(double)};

Implementing `make_integer_sequence`

通过反射来简化实现 make_integer_sequence ：

 1template<typename T>
 2consteval std::meta::info make_integer_seq_refl(T N) {
 3  std::vector args{^T};
 4  for (T k = 0; k  5    args.push_back(std::meta::reflect_value(k));
 6  }
 7  return substitute(^std::integer_sequence, args);
 8}
 9
10template<typename T, T N>
11  using make_integer_sequence = [:make_integer_seq_refl(N):];
12
13static_assert(std




    
::same_as<
14    make_integer_sequence<int, 10>,
15    std::make_integer_sequence<int, 10>
16    >);

这个实现的逻辑也比较清晰，主要涉及两个元函数， reflect_value 和 substitude 。

其中， reflect_value 的声明为：

1namespace std::meta {
2    template<typename T>
3    consteval auto reflect_value(T const&)->info;
4
5    template<typename R>
6    consteval auto reflect_values(R const&)->std::span;
7}

这两个元函数用于将 Constant value(s) lifting 为反射类型(meta::info)表示，比如：

1constexpr std::vector<int> v{ 1, 2, 3 };
2constexpr std::span<std::meta::info> rv = reflect_values(v);

随后，便可以将这个 lifted sequence 重新 Splicing 出来使用，如作为模板参数使用：

1std::integer_sequence<int, ...[:rv:]...> is123;
2// same as std::integer_sequence

以上仅是示例，EDG Reflection 尚不支持 reflect_values ，只支持 reflect_value 。

因此，

1args.push_back(std::meta::reflect_value(k));

的意思，就是生成一个常量序列，再通过生成的序列创建一个 std::integer_sequence ，这需要用到 substitute 元函数，其标准声明为：

1namespace std::meta {
2    consteval auto substitute(info templ, std::span args)
3    ->info { ... };
4}

功能是根据已有类型，提供参数，生成新的类型。一个例子：

 1using namespace std::meta;
 2template<typename ... Ts> struct X {};
 3template<> struct X {};
 4constexpr info type = ^X<int




    
, int, float>;
 5constexpr info templ = template_of(type);
 6constexpr span args = template_arguments_of(type);
 7constexpr info new_type = substitute(templ, args.subspan(0, 2));
 8typename[:new_type:] xii; // Type X, which selects the specialization.
 9                          // There is no mechanism to instantiate a primary template
10                          // definition that is superseded by an explicit/partial
11                          // specialization.

根据 X 生成了新的类型 X 。

但是，EDG 目前有些局限，它使用 std::vector 来代替 std::span ，因此

1substitute(^std::integer_sequence, args);

中才使用 std::vector 来作为参数。

Getting Class Layout

使用反射来获取类布局信息：

 1struct member_descriptor
 2{
 3  std::size_t offset;
 4  std::size_t size;
 5  bool operator==(member_descriptor const&) const = default;
 6};
 7
 8// returns std::array
 9template <typename S>
10consteval auto get_layout() {
11  constexpr size_t N = []() consteval {
12    return nonstatic_data_members_of(^S).size();
13  }();
14
15  std::array layout;
16  [: expand(nonstatic_data_members_of(^S)) :] >> [&, i=0]<auto e>() mutable {
17    layout[i] = {.offset=offset_of(e), .size=size_of(e)};
18    ++i;
19  };
20  return layout;
21}
22
23struct X
24{
25    char a;
26    int b;
27    double c;
28};
29
30constexpr auto Xd = get_layout();
31static_assert(Xd.size() == 3




    
);
32static_assert(Xd[0] == member_descriptor{.offset=0, .size=1});
33static_assert(Xd[1] == member_descriptor{.offset=4, .size=4});
34static_assert(Xd[2] == member_descriptor{.offset=8, .size=8});

get_layout() 是主要逻辑点，用于获取一个类型的非静态数据成员信息，信息保存在 member_descriptor 当中。

由于 EDG 目前不支持 Expansion statements，所以增加了一些实现的复杂度。如果使用 Expansion statements，核心语句将可以这样实现：

1std::array layout;
2int i = 0;
3template for (constexpr auto e : std::meta::nonstatic_data_members_of(^S)) {
4    layout[i] = {.offset=offset_of(e), .size=size_of(e)};
5    ++i;
6}

expand() 是 EDG 对 Expansion statements 的临时平替，实现为：

 1namespace __impl {
 2  template<auto... vals>
 3  struct replicator_type {
 4    template<typename F>
 5      constexpr void operator>>(F body) const {
 6        (body.template operator()(), ...);
 7      }
 8  };
 9
10  template<auto... vals>
11  replicator_type replicator = {};
12}
13
14template<typename R>
15consteval auto expand(R range) {
16  std::vector<std::meta::info> args;
17  for (auto r : range) {
18    args.push_back(reflect_value(r));
19  }
20  return substitute(^__impl::replicator, args);
21}

例子中其他使用的元函数皆顾名思义，逻辑清晰，不再多讲。

Enum to String

最经典的例子，相当于反射界的 Hello world。

过去的文章中已经展示了各种实现，最经典的当属标准的版本：

 1template <typename E>
 2  requires std::is_enum_v
 3constexpr std::string




    
 enum_to_string(E value) {
 4  template for (constexpr auto e : std::meta::members_of(^E)) {
 5    if (value == [:e:]) {
 6      return std::string(std::meta::name_of(e));
 7    }
 8  }
 9
10  return "";
11}
12
13enum Color { red, green, blue };
14static_assert(enum_to_string(Color::red) == "red");
15static_assert(enum_to_string(Color(42)) == "");

及反操作版本：

 1template <typename E>
 2  requires std::is_enum_v
 3constexpr std::optional string_to_enum(std::string_view name) {
 4  template for (constexpr auto e : std::meta::members_of(^E)) {
 5    if (name == std::meta::name_of(e)) {
 6      return [:e:];
 7    }
 8  }
 9
10  return std::nullopt;
11}

但是 EDG 不支持 Expansion statements，所以使用 expand() 代替：

 1template<typename E>
 2  requires std::is_enum_v
 3constexpr std::string enum_to_string(E value) {
 4  std::string result = "";
 5  [:expand(std::meta::enumerators_of(^E)):] >>
 6  [&]<auto e>{
 7    if (value == [:e:]) {
 8      result = std::meta::name_of(e);
 9    }
10  };
11  return result;
12}
13
14enum Color { red, green, blue };
15static_assert(enum_to_string(Color::red) == "red");
16static_assert(enum_to_string(Color(42)) == ""




    
);

这种实现的复杂度为 O(N) ，他们提供了另一种利用 Ranges 算法的实现，只需要 O(log(N)) 的复杂度：

 1template <typename E>
 2  requires std::is_enum_v
 3constexpr std::string enum_to_string(E value) {
 4  constexpr auto enumerators =
 5    std::meta::members_of(^E)
 6    | std::views::transform([](std::meta::info e){
 7        return std::pairstd::string>(std::meta::value_of(e), std::meta::name_of(e));
 8      })
 9    | std::ranges::to<std::map>();
10
11  auto it = enumerators.find(value);
12  if (it != enumerators.end()) {
13    return it->second;
14  } else {
15    return "";
16  }
17}

这种方式借助 std::map 来实现，曾经在 C++ 反射第二章探索也介绍过。

A Simple Tuple Type

与传递递归继承实现法相比，一种更简单的 Tuple 实现法：

 1namespace std::meta {
 2    consteval auto make_nsdm_description(info type, nsdm_options options = {}) {
 3        return nsdm_description(type, options);
 4    }
 5}
 6
 7template<typename... Ts> struct Tuple {
 8  struct storage;
 9
10  static_assert(is_type(define_class(^storage, {make_nsdm_description(^Ts)...})));
11  storage data;
12
13  Tuple(): data{} {}
14  Tuple(Ts const& ...vs): data{ vs... } {}
15};
16
17template<typename... Ts>
18  struct std::tuple_size>: public integral_constant<size_t, sizeof...(Ts)> {};
19
20template<std::size_t




    
 I, typename... Ts>
21struct std::tuple_element> {
22    static constexpr std::array types = {^Ts...};
23    using type = [: types[I] :];
24};
25
26consteval std::meta::info get_nth_nsdm(std::meta::info r, std::size_t n) {
27  return nonstatic_data_members_of(r)[n];
28}
29
30template<std::size_t I, typename... Ts>
31  constexpr auto get(Tuple &t) noexcept -> std::tuple_element_t>& {
32    return t.data.[:get_nth_nsdm(^decltype(t.data), I):];
33  }
34
35template<std::size_t I, typename... Ts>
36  constexpr auto get(Tuple const&t) noexcept -> std::tuple_element_t> const& {
37    return t.data.[:get_nth_nsdm(^decltype(t.data), I):];
38  }
39
40template<std::size_t I, typename... Ts>
41  constexpr auto get(Tuple &&t) noexcept -> std::tuple_element_t> && {
42    return std::move(t).data.[:get_nth_nsdm(^decltype(t.data), I):];
43  }
44
45int main() {
46    auto [x, y, z] = Tuple{1, 'c', 3.14};
47    assert(x == 1);
48    assert(y == 'c');
49    assert(z == 3.14);
50}

能这样实现的关键在于代码生成，而 EDG 当前并不支持 Source code injection，所以他们提供了丐版的替代元函数 std::meta::nsdm_description 和 std::meta::define_class ，允许合成简单的 struct/union 类型。声明为：

1namespace std




    
::meta {
2  struct nsdm_options_t {
3    optional name;
4    optional<int> alignment;
5    optional<int> width;
6  };
7  consteval auto nsdm_description(info type, nsdm_options options = {}) -> info;
8  consteval auto define_class(info class_type, spanconst>) -> info;
9}

nsdm_description 返回给定类型非静态数据成员的反射描述信息， nsdm_options_t 用于指定数据成员的额外信息，比如名称、对齐和宽度，而 define_class 接受一个 Incomplete class/struct/union 和非静态数据成员的反射元信息序列（由 nsdm_description 的返回值构成），这些非静态数据成员将注入到将生成的类型里面。这就是 Source code injection 的基本能力，弱化版的实现。

举个例子：

 1template<typename T> struct S;
 2constexpr auto U = define_class(^S<int>, {
 3  nsdm_description(^int, {.name="i", .align=64}),
 4  nsdm_description(^int, {.name="j", .align=64}),
 5});
 6
 7// S is now defined to the equivalent of
 8// template<> struct S {
 9//   alignas(64) int i;
10//   alignas(64) int j;
11// };

为 S 自动生成的非静态数据成员，如果不指定 nsdm_options_t ，那么生成的数据成员名称默认为 _0 , _1 , _2 ……

回到 Tuple 的实现，传统方法一个是递归继承，一个是递归复合，后者实现时存在许多问题，因此一般利用前者实现。而利用反射的代码生成能力，可以直接合成一个 storage 内部类，所有 Tuple 元素全部注入到该内部类当中，便可以轻易地生成一个 Tuple 类。

借助反射， std::tuple_element 的实现也变得非常简单：

1template<std::size_t I, typename... Ts>
2struct std::tuple_element> {
3    static constexpr std::array types = {^Ts...};
4    using type = [: types[I] :];
5};

std::get 的实现同样简单：

1consteval std::meta::info get_nth_nsdm(std::meta::info r, std::size_t




    
 n) {
2  return nonstatic_data_members_of(r)[n];
3}
4
5template<std::size_t I, typename... Ts>
6  constexpr auto get(Tuple &t) noexcept -> std::tuple_element_t>& {
7    return t.data.[:get_nth_nsdm(^decltype(t.data), I):];
8  }

通过反射，可以直接操纵类型元信息，不再需要额外的奇技淫巧去递归地获取这些信息。

Struct to Struct of Arrays

这也是一个代码生成的例子：

 1namespace std::meta {
 2    consteval auto make_nsdm_description(info type, nsdm_options options = {}) {
 3        return nsdm_description(type, options);
 4    }
 5}
 6
 7template <typename T, std::size_t N>
 8struct struct_of_arrays_impl;
 9
10consteval auto make_struct_of_arrays(std::meta::info type,
11                                     std::meta::info N) -> std::meta::info {
12  std::vector<std::meta::info> old_members = nonstatic_data_members_of(type);
13  std::vector<std::meta::nsdm_description> new_members = {};
14  for (std::meta::info member : old_members) {
15    auto array_type = substitute(^std::array, {type_of(member), N });
16    auto mem_descr = make_nsdm_description(array_type, {.name = name_of(member)});
17    new_members.push_back(mem_descr);
18  }
19  return std::meta::define_class(
20    substitute(^struct_of_arrays_impl, {type, N}),
21    new_members);
22}
23
24template <typename T, size_t N>
25using struct_of_arrays = [: make_struct_of_arrays(^T, ^N) :];
26
27struct point {
28  float x;
29  float y;
30  float z;
31};
32
33int main()




    
 {
34    using points = struct_of_arrays2>;
35
36    points p = {
37        .x={1.1, 2.2},
38        .y={3.3, 4.4},
39        .z={5.5, 6.6}
40    };
41    static_assert(p.x.size() == 2);
42    static_assert(p.y.size() == 2);
43    static_assert(p.z.size() == 2);
44
45    for (size_t i = 0; i != 2; ++i) {
46        std::cout <"p[" <"] = (" <", " <", " <")\n";
47    }
48}
49
50// Output:
51// p[0] = (1.1, 3.3, 5.5)
52// p[1] = (2.2, 4.4, 6.6)

使用的都是之前介绍过的元函数，逻辑也很清晰，就是把当前结构体类型的所有非静态数据成员获取出来，再根据这些信息重新生成数组形式的成员。

最后生成的 points 相当于：

1using points = struct_of_arrays2>;
2// equivalent to:
3// struct points {
4//   std::array x;
5//   std::array y;
6//   std::array z;
7// };

Parsing Command-Line Options

再来看一个利用反射仿 Rust clap(Command Line Argument Parser) 的实现，clap 是 Rust 的命令行参数解析器。

最终效果为：

 1struct Args : Clap {
 2  Option<std::string, {.use_short=true, .use_long=true}> name;
 3  Option<int, {.use_short=true, .use_long=true}> count = 1;
 4};
 5
 6int main(int argc, char** argv) {
 7  auto opts = Args{}.parse(argc, argv);
 8
 9  for (int i = 0; i // opts.count has type int
10    std::print("Hello {}!", opts.name);   // opts.name has type std::string
11  }
12}

例子中定制的 Args 支持两种参数，一个是 name ，一个是 count ，后者具有默认值。如果编译参数为：

1./test -n WG21 -c 7

-n 就对应于 name ， -c 对应于 count 。那么输出结果将为：

1Hello WG21!
2Hello WG21!
3Hello WG21!
4Hello WG21!
5Hello WG21!
6Hello WG21!
7Hello WG21!

你可以在 Args 中定制自己的参数列表，所有的解析操作都封装在 Clap 当中。

要实现这样的效果，首先需要定义 Flags 和 Option 。

 1struct Flags {
 2    bool use_short;
 3    bool use_long;
 4};
 5
 6template <typename T, Flags flags>
 7struct Option {
 8    std::optional initializer;
 9
10    Option() = default;
11    Option(T t) : initializer(t) { }
12
13    static constexpr bool use_short = flags.use_short;
14    static constexpr bool use_long = flags.use_long;
15};

Flags 用于表示参数的形式，比如短形式为 -n ，长形式就为 --name ，根据不同的形式进行不同方式的解析。 Option 用于表示定制的可选参数，有两个构造函数，表示参数值的初始化是可选的。比如只写 ./test -n WG21 ，此时 count 提供默认初始化为 1 ，从而简化参数。

接着，定义解析方式 Clap ：

1struct Clap {
2    template <typename Spec>
3    auto parse(this Spec const& spec, int argc, char** argv) {
4        // ...
5    }
6};

这里使用了 C++23 Deducing this 作为定制点表示方式，从而简化传统的 CRTP 方式。 argc 和 argv 被传递进来，下一步操作：

 1template <typename Spec>
 2auto Clap::parse(this Spec const& spec, int argc, char** argv) {
 3    std::vector<std::string_view> cmdline(argv + 1, argv + argc);
 4
 5    // check if cmdline contains --help, etc.
 6
 7    struct Opts;
 8    static_assert(is_type(spec_to_opts(^Opts, ^Spec)));
 9    Opts opts;
10
11    // ...

如果参数列表为 ./test -n WG21 -c 7 ，那么除了第一个参数，剩余的实际参数都被保存到 cmdline 中，所以 cmdline 的大小为 4。

紧接着开始解析，先通过代码生成自动生成 Opts 类，这个类作为解析的结果，也就是 auto opts = Args{}.parse(argc, argv); 中的 opts 类型。这个返回类型根据用户自定义的 Args 类中的非静态数据成员自动生成，生成后的结构为：

1struct Opts { std::string name; int count; };

生成工作通过 spec_to_opts 完成，实现为：

1consteval auto spec_to_opts(std::meta::info opts, std::meta::info spec) -> std::meta::info {
2    std::vector<std::meta::nsdm_description> new_members;
3    for (auto member : nonstatic_data_members_of(spec)) {
4        auto new_type = template_arguments_of(type_of(member))[0];
5        new_members.push_back(make_nsdm_description(new_type, {.name=name_of(member)}));
6    }
7    return define_class(opts, new_members);
8}

逻辑不算复杂，就是使用前面介绍过的 nsdm_description 和 define_class 来完成简单类型的代码生成工作。

因为不支持 Expansion statements，因此下一步需要借助新类型 Z 和 expand() 来进行参数遍历。

 1template <typename Spec>
 2auto Clap::parse(this Spec const& spec, int argc, char