C++多线程在Linux下处理大数据流

蜗牛互联网技术资讯 2024-11-17 12 0

在Linux环境下，使用C++多线程处理大数据流可以显著提高程序的性能和响应速度。以下是一个简单的示例，展示了如何使用C++11的多线程库（<thread>）和同步原语（<mutex>）来处理大数据流。

示例代码

#include <iostream>
#include <thread>
#include <mutex>
#include <vector>
#include <queue>
#include <condition_variable>

class DataProcessor {
public:
    DataProcessor(size_t num_threads) : stop(false) {
        for (size_t i = 0; i < num_threads; ++i) {
            workers.emplace_back(&DataProcessor::process, this);
        }
    }

    ~DataProcessor() {
        {
            std::unique_lock<std::mutex> lock(queue_mutex);
            stop = true;
        }
        condition.notify_all();
        for (auto& worker : workers) {
            if (worker.joinable()) {
                worker.join();
            }
        }
    }

    void addData(const std::vector<int>& data) {
        {
            std::unique_lock<std::mutex> lock(queue_mutex);
            data_queue.push(data);
        }
        condition.notify_one();
    }

private:
    void process() {
        while (true) {
            std::vector<int> data;
            {
                std::unique_lock<std::mutex> lock(queue_mutex);
                condition.wait(lock, [this] { return !data_queue.empty() || stop; });
                if (stop && data_queue.empty()) {
                    break;
                }
                data = std::move(data_queue.front());
                data_queue.pop();
            }
            // Process the data here
            for (int num : data) {
                std::cout << "Processing: " << num << std::endl;
            }
        }
    }

    std::vector<std::thread> workers;
    std::queue<std::vector<int>> data_queue;
    std::mutex queue_mutex;
    std::condition_variable condition;
    bool stop;
};

int main() {
    DataProcessor processor(4);

    // Simulate adding data to the processor
    for (int i = 0; i < 100; ++i) {
        std::vector<int> data = {i, i * 2, i * 3};
        processor.addData(data);
        std::this_thread::sleep_for(std::chrono::milliseconds(100));
    }

    return 0;
}

代码解释

DataProcessor类:
- 构造函数：初始化多个工作线程，并开始处理数据。
- 析构函数：设置停止标志，通知所有工作线程，并等待它们完成。
- addData方法：向数据队列中添加数据，并通知一个工作线程。
- process方法：工作线程的执行函数，从队列中获取数据并处理。
main函数:
- 创建一个DataProcessor实例，设置4个工作线程。
- 模拟向处理器添加数据，每个批次包含100个整数。