C++如何使用std::set_union求集合并集_C++集合操作与std::set_union实践

std::set_union要求输入序列有序,将两个有序区间合并为并集并存储到输出容器。示例中合并两vector后去重得1 2 3 5 6 7 8 9,需预分配空间并用返回迭代器调整大小。

在C++中,std::set_uniongorithm> 头文件提供的一个标准算法,用于计算两个有序序列的并集。它并不会去重或排序输入序列,因此要求输入数据必须是已排序的,否则结果不可预期。

std::set_union 基本用法

函数原型如下:

template
OutputIterator set_union(InputIterator1 first1, InputIterator1 last1,
                      InputIterator2 first2, InputIterator2 last2,
                      OutputIterator result);

它将 [first1, last1) 和 [first2, last2) 两个区间中的所有元素合并成一个有序序列,保存到 result 指向的位置。相同元素只保留一份(即数学意义上的并集),前提是两个输入序列本身已按升序排列。

实际代码示例

下面是一个使用 std::set_union 合并两个 vector 的完整例子:

#include iostream>
#include
#include

int main() {
    std::vector a = {1, 3, 5, 7, 9};
    std::vector b = {2, 3, 6, 7, 8};
    std::vector result;

    // 预分配空间避免迭代器失效
    result.resize(a.size() + b.size());

    auto it = std::set_union(a.begin(), a.end(),
                     b.begin(), b.end(),
                     result.begin());

    // 调整实际大小
    result.resize(std::distance(result.begin(), it));

    for (int x : result) {
        std::cout     }
    // 输出: 1 2 3 5 6 7 8 9
    return 0;
}

注意事项与常见问题

使用 std::set_union 时需注意以下几点:

  • 输入序列必须已经排序,通常为升序。若未排序,先调std::sort
  • 输出容器需要有足够空间容纳最多 a.size() + b.size() 个元素
  • 返回值是指向结果末尾的迭代器,需用其截断多余容量
  • 适用于任何支持随机访问迭代器的容器,如 vector、array、deque 等
  • 对于 std::set 容器,由于其天然有序,可直接使用

结合 std::set 使用更简洁

如果数据本身用 std::set 存储,则无需手动排序:

std::set s1 = {1, 3, 5};
std::set s2 = {3, 4, 5, 6};
std::vector res;
res.resize(s1.size() + s2.size());

auto it = std::set_union(s1.begin(), s1.end(),
                s2.begin(), s2.end(),
                res.begin());
res.resize(std::distance(res.begin(), it));

基本上就这些。只要记住:有序输入、预留空间、正确处理返回迭代器,就能安全高效地求出两个集合的并集。不复杂但容易忽略细节。