Evolution in SN – Paper中的盲人摸象

看了很多关于对社交网络数据做分析的文章,大部分都让我有一个感觉–盲人摸象。我想来,原因大概有3:

1. 社交网络的数据确实庞大,所以有时候只能通过使用统计的方法得到一些宏观的指标;

2. 数据不全。相当多的paper靠的都是爬虫抓取的社交网络数据,可能只是部分的网络,另外有一些关键性的数据是爬虫无法抓取的,比如用户的注册时间。使用这样的数据,很难去分析得到一些深入和全面的结论;

3. 重理论而轻业务。这是很多做数据分析的新手常犯的错误,拿到数据后就直接上各种算法和分析工具,不愿意去了解数据本身的意义和所处的业务环境。很多paper也是一样,拿到个网络拓扑就想去拓扑中发现各种规律,总结各种理论。但其实这么做很牵强。社交网络和Complex Network的一个最大区别在于它是有环境的,它研究的是人与人社交的关系,而并不仅是一个单纯抽象的graph。社交网络中的每个node的行为和规律不仅仅和拓扑相关,而且和业务相关。

盲人摸象并不一定是贬义。在确实无法看清全貌的时候,通过“摸”来接触事物获取一些直觉是必经之路。

— END. —

Advertisements
相册 | 此条目发表在Evolution in SN, Social Network分类目录。将固定链接加入收藏夹。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s