Social Influence – 如何找有影响力的blog

Paper:Modeling the Spread of Influence on the Blogosphere, www 2006

06年的一篇”老文”,和我最近干的事很类似。

—————————————-

思路其实挺直接的。
blog和blog之间也是有refer的,这样就构成了一个graph。将这个graph反向,其实就可以得到一个influence graph,比如如果blog A引用了blog B,那么B就对A有一定的influence,如下图:

image

这里有些没想明白的是,influence graph中,每个节点的input边的权重之和=1。为什么这样设计?为什么不是output边的权重之和=1?

有了个graph就好办了。直接上PageRank和HITS。
下图是个结果:

image

splog是指spam blog,垃圾广告blog。这图可以看出,HITS的效果是最不好的,排名前几的blog都属于splogs,甚至都比不上Indegree这个方法。PageRank则好了很多。
进一步说明了,HITS确实对spam很敏感,而PageRank则robust得多。
不过我自己的体会,不要使用最简单版本的HITS,而是稍微对算法做一些裁剪,其实不会比PageRank差太多。

— END. —

Advertisements
相册 | 此条目发表在Paper笔记, Social Influence分类目录,贴了, 标签。将固定链接加入收藏夹。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s