Shell脚本curl重定向检测并行加速方法：3种方案让批量巡检速度快10倍

2026.06.04 | youres | 20次围观

前言：串行检测太慢？你需要并行

当你用curl逐个检测几十上百个URL的重定向状态时，串行执行（一个接一个）的效率让人抓狂。假设每个请求平均耗时0.5秒，100个URL就是50秒。如果加上重定向跟随和网络延迟，时间可能翻倍。本文介绍3种Shell脚本并行加速方案，从最简单的xargs到专业的GNU Parallel，让你批量重定向检测速度提升10倍以上。

方案一：xargs -P 并行执行

基本用法

xargs是Linux系统自带的工具，-P参数可以指定并行数量。这是最轻量级的并行方案，不需要安装额外软件：

cat urls.txt | xargs -P 10 -I {} curl -s -o /dev/null -w "%{url_effective} %{http_code} %{num_redirects}\n" -L -m 10 "{}"

参数说明：

-P 10：同时执行10个curl进程
-I {}：将每个URL替换到命令中的占位符
-L：跟随重定向
-m 10：每个请求最长10秒超时

输出格式化到CSV

实际巡检中，我们需要把结果保存到文件。xargs并行执行时输出顺序会乱，所以需要在输出中包含URL信息：

cat urls.txt | xargs -P 20 -I {} sh -c 'curl -s -o /dev/null -w "{} %{url_effective} %{http_code} %{num_redirects} %{time_total}\n" -L -m 10 "{}"' > redirect_check.csv

xargs方案的优缺点

优点：系统自带，无需安装；语法简单；适合中小规模（几十到几百个URL）
缺点：输出顺序不可控；无法方便地控制并发速率（容易打满目标服务器）；错误处理能力弱

方案二：GNU Parallel 专业并行控制

安装与基本用法

GNU Parallel是专门为命令行并行设计的工具，功能远比xargs强大。大多数Linux发行版可以直接安装：

# Debian/Ubuntu
sudo apt install parallel

# CentOS/RHEL
sudo yum install parallel

# macOS
brew install parallel

基本用法和xargs类似，但提供了更多控制选项：

cat urls.txt | parallel -j 20 'curl -s -o /dev/null -w "{} %{url_effective} %{http_code} %{num_redirects}\n" -L -m 10 {}'

限速控制：避免打满目标服务器

批量检测时最怕的就是把目标服务器压垮。GNU Parallel提供了优雅的限速机制：

# 每秒最多发起5个新请求
cat urls.txt | parallel --delay 0.2 -j 20 'curl -s -o /dev/null -w "{} %{url_effective} %{http_code}\n" -L -m 10 {}'

--delay 0.2表示每个请求之间间隔0.2秒（每秒5个），-j 20表示最大并发20个。两个参数配合，既能保持高并发又不会瞬间打满连接。

进度条和结果汇总

cat urls.txt | parallel --progress -j 20 --joblog redirect.log \
  'curl -s -o /dev/null -w "{} %{url_effective} %{http_code} %{num_redirects} %{time_total}\n" -L -m 10 {}' > redirect_check.csv

--progress：显示进度条和ETA
--joblog redirect.log：记录每个任务的执行状态、退出码、耗时到日志文件

GNU Parallel的优缺点

优点：限速控制精细；进度显示和日志记录完善；支持断点续跑；支持SSH远程并行
缺点：需要额外安装；学习曲线略陡；某些精简Linux发行版默认不带

方案三：后台任务+wait批量并行

纯Bash实现

如果你不想安装任何额外工具，纯Bash也能实现并行。原理是利用&把任务放到后台，然后用wait等待全部完成：

#!/bin/bash
MAX_CONCURRENT=15
RUNNING=0

while IFS= read -r url; do
    curl -s -o /dev/null \
      -w "${url} %{url_effective} %{http_code} %{num_redirects} %{time_total}\n" \
      -L -m 10 "${url}" >> redirect_check.csv &
    
    RUNNING=$((RUNNING + 1))
    if [ $RUNNING -ge $MAX_CONCURRENT ]; then
        wait -n
        RUNNING=$((RUNNING - 1))
    fi
done < urls.txt

# 等待所有剩余任务完成
wait
echo "全部完成"

这个脚本的核心逻辑：wait -n会等待任意一个后台任务完成，然后释放一个并发槽位。这样始终维持15个curl同时运行。

超时保护

加一层超时保护更稳妥，防止个别慢请求卡住整个流程：

timeout 15 curl -s -o /dev/null \
  -w "${url} %{url_effective} %{http_code} %{num_redirects}\n" \
  -L -m 10 "${url}" >> redirect_check.csv &

纯Bash方案的优缺点

优点：零依赖，任何Bash环境都能跑；逻辑透明，便于定制；适合嵌入到现有脚本中
缺点：没有进度显示；错误处理需要自己写；并发控制不如GNU Parallel精细

三种方案对比

特性	xargs -P	GNU Parallel	纯Bash
安装要求	系统自带	需安装	系统自带
并发控制	基础	精细（限速/延迟）	中等
进度显示	无	有	无
执行日志	无	有（--joblog）	需自行实现
断点续跑	不支持	支持	需自行实现
适合规模	几十到几百	几百到上万	几十到几百
学习成本	低	中	中

实用建议

并发数不是越大越好：建议从10开始测试，观察目标服务器响应情况和本机CPU/内存占用，逐步调高
一定要加超时：-m 10或--connect-timeout 5，避免单个慢请求拖住整个流程
结果包含原始URL：并行执行时输出顺序不可预测，每行输出必须带上原始URL才能对应分析
分批执行：URL数量超过1000时，建议按域名分组分批检测，避免集中请求单一服务器
配合sort去重：检测完成后用sort -u处理结果，消除重复记录

Shell脚本curl重定向检测并行加速方法：3种方案让批量巡检速度快10倍

前言：串行检测太慢？你需要并行

方案一：xargs -P 并行执行

基本用法

输出格式化到CSV

xargs方案的优缺点

方案二：GNU Parallel 专业并行控制

安装与基本用法

限速控制：避免打满目标服务器

进度条和结果汇总

GNU Parallel的优缺点

方案三：后台任务+wait批量并行

纯Bash实现

超时保护

纯Bash方案的优缺点

三种方案对比

实用建议

延伸阅读

版权声明

发表评论

作者其它文章

AI指纹解锁原理与安全风险分析：全面解读手机生物识别技术

AI数据标注工具推荐与使用方法：5款高效工具帮你快速完成标注任务

OCR 识别教程：从零开始完整部署指南

热门文章

随机文章

最近发表

标签列表

Shell脚本curl重定向检测并行加速方法：3种方案让批量巡检速度快10倍

前言：串行检测太慢？你需要并行

方案一：xargs -P 并行执行

基本用法

输出格式化到CSV

xargs方案的优缺点

方案二：GNU Parallel 专业并行控制

安装与基本用法

限速控制：避免打满目标服务器

进度条和结果汇总

GNU Parallel的优缺点

方案三：后台任务+wait批量并行

纯Bash实现

超时保护

纯Bash方案的优缺点

三种方案对比

实用建议

延伸阅读

版权声明

相关阅读

发表评论

作者其它文章

AI指纹解锁原理与安全风险分析：全面解读手机生物识别技术

AI数据标注工具推荐与使用方法：5款高效工具帮你快速完成标注任务

OCR 识别 教程：从零开始完整部署指南

热门文章

随机文章

最近发表

标签列表

OCR 识别教程：从零开始完整部署指南