Skip to content

Latest commit

 

History

History
416 lines (350 loc) · 11.9 KB

iguana 使用文档.md

File metadata and controls

416 lines (350 loc) · 11.9 KB

简介

iguana 是C++17 实现的header only、跨平台、高性能易用的序列化库,包括xml/json/yaml 的序列化和反序列化。

iguana 的目标是通过编译期间反射将对象序列化到任意数据格式并大幅提升对象的序列化和反序列化的易用性。

如何引入iguana

iguana 是header only的,从github 将iguana clone 下来之后,在cmake 里包含iguana 目录即可。

写代码的时候包含对应的头文件即可:

#include <iguana/json_reader.hpp>
#include <iguana/json_writer.hpp>

编译期反射介绍

编译期反射库介绍

编译器要求

gcc9+、clang11+、msvc2019+

json 序列化/反序列化

iguana 序列化需要先定义一个可反射的对象,通过YLT_REFL 可以轻松定义一个可反射对象。

struct person
{
    std::string_view name;
    int age;
};

#if __cplusplus >= 202002L
YLT_REFL(person, name, age); // 通过这个宏定义元数据让person 成为一个可反射对象
#endif

如果使用C++20 编译器(gcc11+, clang13+, msvc2022)则无需定义YLT_REFL宏的,否则需要通过YLT_REFL 宏定义元数据,定义之后就可以一行代码实现json 的序列化与反序列化了。

person p = { "tom", 28 };

std::string ss;
iguana::to_json(p, ss); // 序列化

person p1;
iguana::from_json(p1, ss); // 反序列化
assert(p1.name == "tom");

异常处理

如果反序列化的时候字符串中的字段类型和结构体定义的字段类型不一致的时候会出现什么情况,比如json 字符串中为string,但是定义结构体时把它定义为int了,这时候iguana 会抛异常,需要外面捕捉异常。

如果存在一些结构体中没有的字段,即unknown 字段时,默认情况下不会抛异常,会忽略不认识的字段,如果希望这时候跑异常,那么需要开启预定义宏 THROW_UNKNOWN_KEY 。

json 的dom 解析

iguana 也提供了dom 解析接口,使用parse 接口时,不需要定义json 对应的结构体。

std::string_view str = R"(false)";
iguana::jvalue val;
iguana::parse(val, str.begin(), str.end());

// 错误码接口
std::error_code ec;
auto b = val.get<bool>(ec);
CHECK(!ec);
CHECK(!b);

// 抛异常的接口
b = val.get<bool>(); // this interface maybe throw exception
CHECK(!b);

最佳实践

零拷贝的反序列化

iguana 支持零拷贝的反序列化,可以完全消除内存分配的开销。

struct some_obj {
    std::string_view name;
    iguana::numeric_str age;
};
YLT_REFL(some_obj, name, age);

void test_view(){
    std::string_view str = "{\"name\":\"tom\", \"age\":20}";
    some_obj obj;
    
    try{
      iguana::from_json(obj, str);
    }catch(std::exception &e){
    }
    
    assert(obj.name == "tom");

    assert(obj.age.value() == "20");

    try{
      int age = obj.age.convert<int>();
      assert(age == 20);
    }catch(std::exception &e){
    }
}

定义结构体时,使用std::string_view 而不是std::string 可以避免内存分配和拷贝。如果希望延迟解析数字类型,可以将数字类型定义为iguana::numeric_str,它也是一个字符串视图,在后面需要数字的时候通过 它的convert方法转换得到数字,如果转换失败则会抛异常。

更高效的反序列化

iguana 不要求结构体字段顺序和json 的字段顺序一致,但是如果能保证结构体顺序和json 字段顺序一致则可以提高反序列化效率。

xml 序列化/反序列化

和json 类似,先定义xml 数据对应的结构体,再通过to_xml/from_xml 实现序列化和反序列化。

struct some_obj {
    std::string_view name;
    int age;
};
YLT_REFL(some_obj, name, age);

void test() {
    person p = {"admin", 20};
    std::string_view ss;  // here use std::string is also ok
    iguana::to_xml(p, ss);
    std::cout << ss << std::endl;
    
    // deserialization the structure from the string
    std::string_view xml = R"(
    <?xml version=\"1.0\" encoding=\"UTF-8\">  
    <root> 
      <name>buke</name> 
      <age>30</age> 
    </root>)";
    iguana::from_xml(p, xml);
}

pretty 格式化xml

struct person {
    std::string_view name;
    int age;
};
YLT_REFL(person, name, age);

void test_pretty() {
    person p{"tom", 20};
    std::string str;
    iguana::to_xml(p, str);
    std::cout<<str<<"\n";// <person><name>tom</name><age>20</age></person>

    str.clear();
    iguana::to_xml<true>(p, str);
    std::cout<<str<<"\n";
    /*
     <person>
	   <name>tom</name>
	   <age>20</age>
     </person>
     */
}

to_xml 模式输出的xml 字符串在一行,如果希望pretty 输出则传true 参数给to_xml。

xml 属性解析

在 XML 属性解析中,提供了两种类型:xml_attr_txml_attr_view_t。其中xml_attr_view_t使用std::map<std::string_view, std::string_view>保存属性值,使用该类型不会复制字符串,但需要注意 string_view 的生命周期不能超过原始字符串。而xml_attr_t 使用 std::unordered_map<std::string, std::string> 保存属性值,这解除了对生命周期的顾虑,但复制字符串可能会降低性能。

除了将属性值解析为字符串,也支持自定义属性KV的类型(一般为数字)。例如,若需解析属性值为整型,可以定义如下:

template <typename T>
using xml_attr_int_t = iguana::xml_attr_t<T, std::map<std::string, int>>;

以下是使用 xml_attr_t的例子:

struct book_t {
  std::string title;
  std::string author;
};
YLT_REFL(book_t, title, author);
struct library {
  iguana::xml_attr_t<book_t> book;
};
YLT_REFL(library, book);
TEST_CASE("test library with attr") {
  auto validator = [](library lib) {
    CHECK(lib.book.attr()["id"] == "1234");
    CHECK(lib.book.attr()["language"] == "en");
    CHECK(lib.book.attr()["edition"] == "1");
    CHECK(lib.book.value().title == "Harry Potter and the Philosopher's Stone");
    CHECK(lib.book.value().author == "J.K. Rowling");
  };
  std::string str = R"(
  <?xml version="1.0" encoding="UTF-8"?>
  <library name="UESTC library">
    <book id="1234" language="en" edition="1">
      <title>Harry Potter and the Philosopher's Stone</title>
      <author>J.K. Rowling</author>
    </book>
  </library>
)";
  {
    library lib;
    iguana::from_xml(lib, str);
    validator(lib);
  }
  {
    iguana::xml_attr_t<library> lib;
    iguana::from_xml(lib, str);
    CHECK(lib.attr()["name"] == "UESTC library");
    validator(lib.value());
  }
}

字段别名

一般情况下iguana 要求定义的结构体字段和被解析字符串如xml 字符串中的标签名称一一对应,比如下面的例子:

struct some_obj {
    std::string_view name;
    int age;
};
YLT_REFL(some_obj, name, age);

void test() {
    std::string_view xml = R"(
    <?xml version=\"1.0\" encoding=\"UTF-8\">  
    <root> 
      <name>buke</name> 
      <age>30</age> 
    </root>)";
    
    some_obj p;
    iguana::from_xml(p, xml);
}

xml 标签name 和 age 对应的就是结构体some_obj::name, some_obj::age,正确解析要求结构体的名称必须和xml 标签name,age 名称完全相同。

有时候这个约束对于一些已经存在的结构体可能存在一些不便之处,已有的结构体字段名可能和xml 标签名字不相同,这时候可以通过字段别名来保证正确解析。

std::string xml_str = R"(
<?xml version="1.0" encoding="utf-8"?>
<rootnode version="1.0" type="example">
  <id entry="1">20</id>
  <name entry="2">tom</name>
</rootnode>
)";

class person {
    std::shared_ptr<std::string> id_;
    std::unique_ptr<std::string> name_;

public:
    person() = default;
    person(std::shared_ptr<std::string> id, std::unique_ptr<std::string> name) : id_(id), name_(std::move(name)) {}

    static constexpr auto get_alias_field_names(person*) {
      return std::array{field_alias_t{"id", 0}, field_alias_t{"name", 1}};
    }
    static constexpr std::string_view get_alias_struct_name(person*) {
      return "rootnode";
    }
    YLT_REFL(person, id_, name_);

    void parse_xml() {
        iguana::from_xml(*this, xml_str);

        assert(*id_ == "20");
        assert(*name_ == "tom");
    }
}

get_alias_field_names 函数中需要填写结构体的别名,get_alias_struct_name 函数中填写字段的别名,别名字段的索引需要和YLT_REFL宏定义的字段顺序一致,通过别名将标签和结构体字段关联起来就可以保证正确的解析了。

这个例子同时也展示了iguana 支持智能指针的序列化和反序列化。

如何处理私有字段

如果类里面有私有字段,在外面定义YLT_REFL 宏会出错,因为无法访问私有字段,这时候把宏定义到类里面即可,但要保证宏是public的。

class person {
    std::string name;
    int age;
public:
    YLT_REFL(person, name, age);
};

yaml 序列化/反序列化

和json,xml 类似:

enum class enum_status {
  start,
  stop,
};
struct plain_type_t {
  bool isok;
  enum_status status;
  char c;
  std::optional<bool> hasprice;
  std::optional<float> num;
  std::optional<int> price;
};
YLT_REFL(plain_type_t, isok, status, c, hasprice, num, price);
// deserialization the structure from the string
std::string str = R"(
isok: false
status: 1
c: a
hasprice: true
num:
price: 20
)";

plain_type_t p;
iguana::from_yaml(p, str);
// serialization the structure to the string
std::string ss;
iguana::to_yaml(ss, p);
std::cout << ss << "\n";

如何将enum 作为字符串处理

一般情况下iguana 会将enum 按照int 去处理,如果希望将enum 按照字符串名称去处理,则需要定义enum_value来做适配。

enum class Status { STOP = 10, START };
struct enum_t {
    Status a;
    Status b;
};
YLT_REFL(enum_t, a, b);

namespace iguana {
    template <> struct enum_value<Status> {
        constexpr static std::array<int, 2> value = {10, 11};
    };
} // namespace iguana

void test() {
    std::string str1 = R"(
{
  "a": "START",
  "b": "STOP"
}
  )";
    // deserialization
    enum_t e;
    iguana::from_json(e, str1);
    
    // serialization
    enum_t e1;
    e1.a = Status::START;
    e1.b = Status::STOP;
    std::string ss;
    iguana::to_json(e1, ss);
    std::cout<<ss<<"\n"; // {"a":"START","b":"STOP"}
}

通过特化iguana 命名空间里的模版类enum_value,将枚举的值填充到其内部的array 中即可实现按字符串处理enum 了。

如何自定义浮点数的序列化

iguana 中,浮点数默认通过 jkj::dragonbox::to_chars 进行序列化。如有特定需求,可以自定义浮点数序列化方法,需遵守以下要求:

  • iguana 命名空间内定义并实现名为 to_chars_float 的模板函数。

  • 为确保该自定义模板被iguana找到,需在引入 iguana 相关头文件之前定义该模板。

    namespace iguana {
    template <typename T>  // T是float或者double
    inline char* to_chars_float(T value, char* buffer) {
    // 该函数将浮点数 value 序列化到 buffer 中,假设 buffer 长度为 65 字符,足以存储序列化后的结果。
    // 返回值是指向最后一个被写入字符后一位置的指针。
    }
    } // namespace iguana
    
    #include <iguana/json_reader.hpp>
    #include <iguana/json_writer.hpp>

如下是使用snprintf自定义序列化的例子 :

#include <charconv>  // for to_chars
#include <iostream>  // for std::cout
namespace iguana {
template <typename T>
inline char* to_chars_float(T value, char* buffer) {
  std::cout << "call custom to_chars_float with snprintf\n";
  return buffer + snprintf(buffer, 65, "%g", value);
}
}  // namespace iguana

#include <iguana/json_reader.hpp>
#include <iguana/json_writer.hpp>
struct test_float_t {
  double a;
  float b;
};
YLT_REFL(test_float_t, a, b);
void user_defined_tochars_example() {
  test_float_t t{2.011111, 2.54};
  std::string ss;
  iguana::to_json(t, ss);
  std::cout << ss << std::endl;
}
int main(void) {
  user_defined_tochars_example();
  return 0;
}