chzhn - 2009-12-24 16:46:00
前850页的统计结果为:
ID 发帖数
茶馆小二 27
飞天樱花 745
某籹孜 412
日蔓 1231
塃榞丷駿 236
kelly35 41
女校男生 896
筱妖 16
月光中的云海 1
networkedition 2
09kaka 339
狮子座小皮 1
帅乖 48
云腾四海 469
鬼鬼小猫咪 494
羽叶飘零 1177
西丁宁国 14
紫漠莲落 2
傻小儿 1
黑帮阿大 1
流氓小三 1
米奇aa 76
P专业大喷壶oO 53
万事达 3
鬼鬼小猫咪 4
鬼鬼小猫咪 1
鬼鬼小猫咪 1
青菜香菇 1
is猫咪吖 372
茶馆小一 1
ehappyboy 33
塃塬丷骏 2
茶馆老大 1
神云是神 1
神神小猫咪 2
朋♂友 2
非常帅的狐狸头 2
lhblhlh 1
生化战士 1
鷍鷍 17
chzhn 1
梦幻の星oо 251
9876532 3
jks_风 523
shouhou 158
zengjie5927 28
aaccbbdd 236
钱夫子 103
茶馆老板娘 19
yqlikaka 34
跑步的鱼儿 1
嗸⑧杩 2
toy_糖果 1
qiouyu 57
A小可 1
冰心一点 1
BAGGIO·18 157
政府 1
饼饼2008 1
土哦哦土@ 3
就算是风也好 151
朗州司马 1
lwqzyx 2
大拇哥二目的 1
关城小亮 20
7猫猫7 2
soaika 3
会飞的鱼0000 1
火神gggg 1
用户系统信息:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0)
茶馆小二 - 2009-12-24 16:47:00
我晕
这怎么得到的?
:kaka18: 是不是有好办法
帅哥阿福 - 2009-12-24 16:49:00
估算
zengjie5927 - 2009-12-24 16:50:00
小二可以去后台看看!
羽叶飘零 - 2009-12-24 16:51:00
额。。。。。:kaka6:
chzhn - 2009-12-24 16:51:00
你自己加一下看看总结果吧,我想应该是没有错误的,到1000页的时候再发一次统计结果。
鬼鬼小猫咪 - 2009-12-24 16:51:00
估计跟百度贴吧的一样.....:kaka12:
jks_风 - 2009-12-24 16:52:00
是不是直接搜索ID,还是怎么招呢?帮帮二哥吧~:kaka8:
女校男生 - 2009-12-24 16:52:00
支持管理员锁帖,我们要吃饭!
chzhn - 2009-12-24 16:54:00
我自己写的爬虫程序
ref class TieZi
{
public:
// 楼层
int nID;
// 发帖人
String^ UserName;
// 发帖的时间
DateTime^ dataTime;
// 帖子的内容
String^ contentText;
};
ref class SendTieZi
{
public:
// 发帖人
String^ UserName;
// 所有的帖子
List<TieZi^>^ arrTieZi;
};
//添加一个帖子到所有帖子列表中
void AddTieZi(List<SendTieZi^>^ arrAllUserTieZi,TieZi^ tiezi)
{
if (tiezi == nullptr || tiezi->UserName->Equals(""))
{
return;
}
for each(SendTieZi^ sendTiezi in arrAllUserTieZi)
{
if (sendTiezi->UserName->Equals(tiezi->UserName))
{
sendTiezi->arrTieZi->Add(tiezi);
return;
}
}
SendTieZi^ newUser = gcnew SendTieZi;
newUser->UserName = tiezi->UserName;
newUser->arrTieZi = gcnew List<TieZi^>();
arrAllUserTieZi->Add(newUser);
}
//添加一个页面的所有帖子到列表中
void AddWebAllTieZi(List<SendTieZi^>^ arrAllUserTieZi,String^ webUrl,int nPos)
{
WebClient^ webClient = gcnew WebClient;
// 下载页面内容
String^ webText = Encoding::UTF8->GetString(webClient->DownloadData(webUrl));
Regex^ regexMatchName = gcnew Regex("<div\\s*id=\"memberinfo_(?<id>\\d+)[^<>]*>\\s*<[^<>]*>\\s*(?<name>[^<>]+)\\s*</div>",RegexOptions::IgnoreCase);
MatchCollection^ matchs = regexMatchName->Matches(webText);
for each(Match^ m in matchs)
{
TieZi^ tiezi = gcnew TieZi;
tiezi->UserName = m->Groups["name"]->Value->Trim();
tiezi->nID = nPos*10+Convert::ToInt32(m->Groups["id"]->Value->Trim());
AddTieZi(arrAllUserTieZi,tiezi);
}
}
void GetAll()
{
List<SendTieZi^>^ arrAllUserTieZi = gcnew List<SendTieZi^>();
for (int i = 1 ; i < 850 ; i++ )
{
String^ strWebUrl = String::Format("http://bbs.ikaka.com/showtopic-8685806-{0}.aspx",i);
Console::Clear();
Console::WriteLine("正在处理第{0}页......",i);
AddWebAllTieZi(arrAllUserTieZi,strWebUrl,i);
}
for each(SendTieZi^ sendTiezi in arrAllUserTieZi)
{
Console::WriteLine(sendTiezi->UserName + "\t" + sendTiezi->arrTieZi->Count);
}
}
女校男生 - 2009-12-24 16:54:00
技术工人有力量
女校男生 - 2009-12-24 16:55:00
:kaka11: 您还有锁帖子的程序吗?
茶馆小二 - 2009-12-24 16:55:00
:kaka7: 太牛了!!!
女校......
为啥要锁帖才能吃饭:kaka7:
这样去吃也可以的...
别耽误正事儿哈
小二会愧疚
茶馆小二 - 2009-12-24 16:55:00
原帖由 女校男生 于 2009-12-24 16:55:00 发表
:kaka11: 您还有锁帖子的程序吗?
:kaka6: 我就汗了
女校和锁帖杆上了:kaka12:
鬼鬼小猫咪 - 2009-12-24 16:57:00
好厉害啊
塃榞丷駿 - 2009-12-24 16:58:00
這家伙真的是研發部的啊
:kaka6:
還好意思找我要HB
女校男生 - 2009-12-24 17:00:00
不锁帖我吃不安稳
女校男生 - 2009-12-24 17:00:00
他们把我的楼层都抢了 :kaka4:
© 2000 - 2026 Rising Corp. Ltd.