Rust vs C++: A Performance Comparison

本文内容节选自：

Aliasing 数据别名
- Reference 不同于 raw pointer：总是有效的指针（除了 danglin ），对齐。
- &T 确保数据不可变，可以进行寄存器存储等激进的优化措施。这在C++中并不可行。
- &mut T 可以确保独占，在本文中的案列中，mul_by_2 的 src 和 dest 可以确保不会引用同一个区域（两个slice无数据重叠），因而在生成的代码中，可以进行如下的优化：使用 movdqu 等指令一次移动 16 字节内容（相当于2个u64)。
- 如果是 *const T 指针，则不会保证引用同一个区域，需要先进行检测，才能使用 movdqu 等指令进行移动处理。
验证代码 playgroud 链接，可以查看其生成的ASM代码的差异
Move 语义 C++ 的 std::move 模拟了一个 move 语义，但又不能象 Rust 一样的保证原始变量不能再被访问。我对 C++ 11引入的这些概念并不熟悉，只是感觉 std::move 和 std::forward 相比 rust 来说，要复杂很多。

通过 move 语义，编译期可以进行更多的优化，比如在函数调用时，可以选择不再复制数据，而是直传递用数据的指针，这样可以避免数据的复制。验证代码：move playground
- 由于 rust 做了太多的优化，如果结构体较小的话，就直接通过寄存器传递参数了，反而可能不走地址传递的优化。
Dynamic dispatch C++ 的 VTBL 开销对 virtual 函数来说是必不可少的，及每个对象都会携带一个 VTBL 指针，除了占用内存的开销之外，VTBL调用也会是2次访问，同时也阻碍了 inline 的优化。而 Rust 的 Trait 可以通过 Generic 来实现完全静态的多态，除了会增加代码体积之外，无而外开销。也可以通过&dyn 方式实现动态的多态。算是一个不错的平衡。
Struct Layout and Padding.
- C++ 的 struct 的内存布局与字段的定义顺序有关，可能会消耗更多的内存。而 Rust 默认则最优化内存布局，从而减少内存占用。(对 vec 这样的应用，会因为减少内存的占用而提高 cache 命中率，从而提高性能)
- Rust 的 enum 类型很难在C++中表达
- 诸如 Option 这样的类型对 &T 来说是零开销的，即根本不存在 tag 的开销。这也是一个很神奇的设计，
- 兼顾简洁和性能，堪称 Zero Cost Abstract 的典范。再看看 Scala 的 Option 瞬间就不香了。
- 在 Rust 中很广泛的使用 struct 嵌套的方式来定义新的数据类型，包括 Rc, RefCell 等，而在 Scala 中为了到达类似的zero cost效果，可以通过 opaque type 来实现，但是这样的代码会更加复杂，还是 Rust 的设计更加优雅。
Compile-time computations. 应该说 comptime 方面，Rust 通过 const, constexp 关键字提供了简单，但并不够强大的支持。在这方面，C++、Zig、Scala语言都走得更远。不过，Rust 中，我们可以通过 Macro 来实现相似的功能。或许，在 comptime 这一块，最优特色的应该是 zig 语言了。

当然 Scala 的 Macro 也是非常完备的，不过复杂性也有些令人生畏了。

我在 wsql/wjson 这两个库的开发中，借助于 Macro 的能力，提供了用户友好的API，这些没有 macro 的助力，是不可能的。
- 从 ADT 类型自动提供 ResultSetMapping / JsonValueMapping 功能（在 Java 中有个 mapstruct 的框架，不够显然比不上 wjson/wsql 提供的映射支持的简洁和强大）
- wsql 对 mysql insert batch 的自动改写
- wsql 中提供的 BeanBuilder 提供了类型强大的编译期间的 BeanCopy 功能。兼顾性能与 type safe.