nodejs 并发控制

本文隶属于分类

Web开发

推荐文章

广告推荐

技术交流学习或者有任何问题欢迎加群 : 154514123 爱上编程

标签:time   添加   !=   syn   事件   http   bre   一个   title   

1.用 eventproxy 实现:

var EventProxy = require(‘eventproxy‘);

const most = 5;//并发数5
var urllist = [....];//待抓取url列表,100个

function foo(start){
    var ep = new EventProxy();
    ep.after(‘ok‘,most,function(){
        foo(start+most);//一个批次任务完成,递归进行下一批任务
    });
    var q=0;
    for(var i=start;i<urllist.length;i++){
        if(q>=most){
            break;//最多添加most个任务
        }
        http.get(urllist[i],function(res){
            //....
            res.on(‘end‘,function(){
                ep.emit(‘ok‘);//一个任务完成,触发一次ok事件
            });
        });
        q++;
    }
}
foo(0);

2.async.queue 非常合适用来控制并发

/**
 * Created by admin on 16/3/20.
 */
"use strict"
var http = require(‘http‘);
var cheerio = require(‘cheerio‘);
var URL = require(‘url‘);
var path = require(‘path‘);
var fs = require(‘fs‘);
var async = require(‘async‘);

var baseUrl = "http://cnodejs.org/";
var targetUrl = "http://cnodejs.org/";
var stime = new Date();

function sGet(url,callback){
  var chunks = [];
  http.get(url,(res)=>{
    if (res.statusCode != ‘200‘) {
      callback({message:"抓取失败,状态码:"+res.statusCode,url:url});
      return;
    }
    res.on(‘data‘,(chunk)=>{
      chunks.push(chunk);
    });
    res.on(‘end‘,()=>{
      callback(null,Buffer.concat(chunks).toString());
    });
  }).on(‘error‘,(e)=>{
    callback({message:"抓取失败",url:url,err:e});
  });
}

sGet(targetUrl,(err,data)=>{
  if (err) {
    console.log(err);
    return false;
  }
  var $ = cheerio.load(data);
  var anchors = $("#topic_list a.topic_title");
  console.log(‘共‘+anchors.length+‘个任务‘);

  const most=5;//并发数
    //创建队列并指定并发数
  var q=async.queue(function(url,callback){
    var filename = path.basename(url)+‘.txt‘;
    sGet(url, (err, data)=> {
      if (err) {
        callback(err);
        return false;
      }
      fs.writeFile(‘./html/‘ + filename, data, function (err) {
        if (err) {
          throw err;
        }
        callback(null,filename);
      });
    });
  },most);

  q.drain = function() {
    console.log(‘任务全部完成,共耗时:‘+(new Date()-stime)+‘ms‘);
  }

  anchors.each(function(){
    var url = URL.resolve(baseUrl,$(this).attr(‘href‘));
    q.push(url,function(err,filename){
      if (err) {
        console.log(err);
        return;
      }
      console.log("finished:"+filename);
    });
  });
});

 

nodejs 并发控制

标签:time   添加   !=   syn   事件   http   bre   一个   title   

原文:http://www.cnblogs.com/cnshen/p/6273299.html

技术交流学习或者有任何问题欢迎加群 : 154514123 爱上编程

广告推荐

讨论区