Jun 2025

Languages

  1. Rust
  2. SIMD
    • simd-everywhere 软件仿真的方式模拟 SIMD 指令。ARM 的 SIMD 指令参考资料很难阅读,可以通过 这个站点,来理解这些指令是如何仿真执行的。不过,好像有不少指令并没有实现。
    • a plan for simd Linebender的 SIMD 实现计划。
      • 使用 256 bit width: 能很好的匹配 AVX2, 在 NEON 上使用2个寄存器进行模拟。考虑到 Neon 有32个128位寄存器,仍然有足够的处理能力(在M1系列芯片上,基本等效于16 x 256 的AVX2)。
      • 文中提到 AVX512 相比 AVX256,性能提升有限,a 512 bit vector is processed in two clock cycles (see mersenneforum post for more details), each handling 256 bits, 这种说法,但没有提到确切的信息来源。
      • Milvis 中有 AVX2 vs AVX512 的对比,有提升 20%-65%。
      • AVX512 可能会导致 CPU 降频,最终性能提升打了折扣。

MPP & OLAP

  1. DuckDB 源代码阅读系列文章

Web & Frontend

  1. How Rolldown Works

Tools & Libraries