瑞星卡卡安全论坛综合娱乐区Rising茶馆 本次灌水大赛的灌水统计

12   1  /  2  页   跳转

[版聊] 本次灌水大赛的灌水统计

本次灌水大赛的灌水统计

前850页的统计结果为:
ID                  发帖数
茶馆小二        27
飞天樱花        745
某籹孜          412
日蔓              1231
塃榞丷駿        236
kelly35          41
女校男生        896
筱妖              16
月光中的云海    1
networkedition  2
09kaka            339
狮子座小皮      1
帅乖              48
云腾四海        469
鬼鬼小猫咪      494
羽叶飘零        1177
西丁宁国        14
紫漠莲落        2
傻小儿            1
黑帮阿大        1
流氓小三        1
米奇aa              76
P专业大喷壶oO  53
万事达                3
鬼鬼小猫咪      4
鬼鬼小猫咪    1
鬼鬼小猫咪    1
青菜香菇        1
is猫咪吖        372
茶馆小一        1
ehappyboy      33
塃塬丷骏        2
茶馆老大        1
神云是神        1
神神小猫咪      2
朋♂友                2
非常帅的狐狸头  2
lhblhlh            1
生化战士        1
鷍鷍                17
chzhn                  1
梦幻の星oо    251
9876532  3
jks_风                  523
shouhou          158
zengjie5927    28
aaccbbdd        236
钱夫子              103
茶馆老板娘      19
yqlikaka        34
跑步的鱼儿      1
嗸⑧杩          2
toy_糖果        1
qiouyu            57
A小可                1
冰心一点        1
BAGGIO·18      157
政府                  1
饼饼2008        1
土哦哦土@      3
就算是风也好    151
朗州司马        1
lwqzyx              2
大拇哥二目的    1
关城小亮        20
7猫猫7              2
soaika            3
会飞的鱼0000    1
火神gggg        1

用户系统信息:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0)
最后编辑chzhn 最后编辑于 2009-12-24 16:47:01
分享到:
gototop
 

回复:本次灌水大赛的灌水统计

我晕
这怎么得到的?
是不是有好办法

娱乐区官方群——113762779,加入请注明论坛昵称  O(∩_∩)O点击惊现很多美女,很多贡献,很多滴欢乐O(∩_∩)O
神人到处有,茶馆特别多。谁让我开不成茶馆,我就让ta2012。在我二成一种传奇之后,再也不用羡慕其他人了。
gototop
 

回复 2F 茶馆小二 的帖子

估算
╭∩╮(︶︿︶)╭∩╮
gototop
 

回复:本次灌水大赛的灌水统计

小二可以去后台看看!
gototop
 

回复:本次灌水大赛的灌水统计

额。。。。。
我固守我的精彩!
gototop
 

回复:本次灌水大赛的灌水统计

你自己加一下看看总结果吧,我想应该是没有错误的,到1000页的时候再发一次统计结果。
gototop
 

回复 2F 茶馆小二 的帖子

估计跟百度贴吧的一样.....


gototop
 

回复:本次灌水大赛的灌水统计

是不是直接搜索ID,还是怎么招呢?帮帮二哥吧~
gototop
 

回复:本次灌水大赛的灌水统计

支持管理员锁帖,我们要吃饭!
卡卡第一魅力男生 卡卡十大杰出青年
卡卡十大热心会员 卡卡十大青年新锐
卡卡十大文明标兵 卡卡十大青年才俊
卡卡共青团十大青年先锋
2006年上半年卡卡最大发现
2006年度最佳新人 2007年度最佳会员
2007年度感动卡卡十大青年
2008年度感动卡卡十大青年
2008年上半年因成绩优秀授予嘉宾称号
2008年授予卡卡终身成就奖
2008年度最佳水手评选(内部)提名
2008卡卡风云人物
gototop
 

回复:本次灌水大赛的灌水统计

我自己写的爬虫程序


ref class TieZi
{
public:
    // 楼层
    int nID;
    // 发帖人
    String^ UserName;
    // 发帖的时间
    DateTime^ dataTime;
    // 帖子的内容
    String^ contentText;
};

ref class SendTieZi
{
public:
    // 发帖人
    String^ UserName;
    // 所有的帖子
    List<TieZi^>^ arrTieZi;
};

//添加一个帖子到所有帖子列表中
void AddTieZi(List<SendTieZi^>^ arrAllUserTieZi,TieZi^ tiezi)
{
    if (tiezi == nullptr || tiezi->UserName->Equals(""))
    {
        return;
    }
    for each(SendTieZi^ sendTiezi in arrAllUserTieZi)
    {
        if (sendTiezi->UserName->Equals(tiezi->UserName))
        {
            sendTiezi->arrTieZi->Add(tiezi);
            return;
        }
    }
    SendTieZi^ newUser = gcnew SendTieZi;
    newUser->UserName = tiezi->UserName;
    newUser->arrTieZi = gcnew List<TieZi^>();
    arrAllUserTieZi->Add(newUser);
}

//添加一个页面的所有帖子到列表中
void AddWebAllTieZi(List<SendTieZi^>^ arrAllUserTieZi,String^ webUrl,int nPos)
{
    WebClient^ webClient = gcnew WebClient;
    // 下载页面内容
    String^ webText = Encoding::UTF8->GetString(webClient->DownloadData(webUrl));
    Regex^ regexMatchName = gcnew Regex("<div\\s*id=\"memberinfo_(?<id>\\d+)[^<>]*>\\s*<[^<>]*>\\s*(?<name>[^<>]+)\\s*</div>",RegexOptions::IgnoreCase);
    MatchCollection^ matchs = regexMatchName->Matches(webText);
    for each(Match^ m in matchs)
    {
        TieZi^ tiezi = gcnew TieZi;
        tiezi->UserName =  m->Groups["name"]->Value->Trim();
        tiezi->nID = nPos*10+Convert::ToInt32(m->Groups["id"]->Value->Trim());
        AddTieZi(arrAllUserTieZi,tiezi);
    }
}

void GetAll()
{
    List<SendTieZi^>^ arrAllUserTieZi = gcnew List<SendTieZi^>();
    for (int i = 1 ; i < 850 ; i++ )
    {
        String^ strWebUrl = String::Format("http://bbs.ikaka.com/showtopic-8685806-{0}.aspx",i);
        Console::Clear();
        Console::WriteLine("正在处理第{0}页......",i);
        AddWebAllTieZi(arrAllUserTieZi,strWebUrl,i);
    }
    for each(SendTieZi^ sendTiezi in arrAllUserTieZi)
    {
        Console::WriteLine(sendTiezi->UserName + "\t" + sendTiezi->arrTieZi->Count);
    }
}
gototop
 
12   1  /  2  页   跳转
页面顶部
Powered by Discuz!NT