c++如何实现一个简单的Fiber(纤程)库_c++用户态线程调度【并发】

C++手写Fiber库需实现栈隔离、上下文切换和协作式调度器:用mmap/VirtualAlloc分配私有栈,inline asm或setjmp/longjmp保存寄存器,deque管理就绪队列,yield/resume控制协程让出与恢复,注意异常安全与对象生命周期。

用 C++ 实现一个简单的 Fiber(纤程)库,核心是用户态协程切换,不依赖操作系统线程调度,而是通过保存/恢复寄存器上下文实现轻量级并发。关键在于 栈隔离 + 上下文切换 + 调度器 三部分,下面分步说明如何手写一个最小可用版本。

1. 栈管理:每个 Fiber 独立栈空间

Fiber 必须有自己私有的栈,否则函数调用会覆盖主线程栈。通常用 mmap(Linux/macOS)或 VirtualAlloc(Windows)申请页对齐的内存,并手动设置栈顶指针。

  • 推荐栈大小:64KB~1MB(太小易溢出,太大浪费)
  • 栈增长方向:x86/x64 是向下增长,所以栈顶 = 分配地址 + 大小
  • 注意:栈内存需设为可执行(若含 inline asm 切换)或至少可读写

2. 上下文切换:用 setjmp/longjmp 或 inline asm

最便携的方式是 setjmp/longjmp,但仅支持同一线程内跳转,且不能跨函数栈帧保存完整上下文(如浮点寄存器、SIMD 寄存器可能丢失)。生产环境建议用 inline asm(如 x86-64 的 mov %rsp, xxx + mov xxx, %rsp),手动保存/恢复 rbp, rbx, r12–r15 等被调用者保存寄存器。

  • make_fcontext:初始化目标栈,填入入口函数地址和参数(可封装为 struct)
  • jump_fcontext:原子切换 rsp + rip,同时传入返回值(常通过 rax 传递)
  • 避免在切换前后调用可能被优化掉的函数(如编译器可能把局部变量放寄存器中,导致切换后丢失)

3. 调度器:单线程轮转(cooperative scheduling)

Fiber 是协作式调度,没有抢占;每个 Fiber 运行到主动让出(yield)或阻塞(如等待 I/O)时,才交出控制权。调度器本质是一个就绪队列 + 当前运行 Fiber 指针:

  • std::deque 存就绪 Fiber,支持快速头插尾取
  • schedule():取出队首 Fiber,swapcontext 切过去;若空,则切回主 Fiber(即调度器自身)
  • yield():把当前 Fiber 插入队尾,再调用 schedule()
  • 主 Fiber 可作为“空闲协程”或用于初始化/清理,也可直接用主线程栈模拟

4. 封装与使用:面向对象接口

对外暴露简洁 API,例如:

  • Fiber f([]{ do_work(); }); —— 构造即启动(惰性或立即)
  • f.resume() / Fiber::yield() —— 显式挂起和恢复
  • static void sleep_ms(int ms) —— 非阻塞睡眠(注册定时器 + yield)
  • 异常安全:确保 Fiber 析构时栈已结束、上下文已释放,避免 double-free

注意:C++ 异常跨越 setjmp 是未定义行为,务必在 Fiber 入口 catch 全局异常,或禁用异常(-fno-exceptions)。

基本上就这些。不复杂但容易忽略细节:栈对齐、寄存器保存范围、C++ 对象生命周期(尤其栈上对象在切换后是否仍有效)、线程局部存储(TLS)变量在 Fiber 切换时不自动切换。进阶可加 await 支持、I/O 多路复用集成(epoll/iocp)、Fiber 局部存储(FLS)等。真正工程化推荐用 Folly::coro、Boost.Context 或 C++20 协程。