巴比特专栏 | 从百家号到买热搜:中心化互联网的区块链之变(上)

巴比特专栏 | 从百家号到买热搜:中心化互联网的区块链之变(上)

时间:2019-2-7 分享到:

关注科技领域的朋友们应该都被一条新闻给刷屏了,那就是人们发现自己曾经十分信任的、被称为“更懂中文”的百度搜索引擎,变成了百度内置自媒体“百家号”重要的引流工具,这使得百度搜索结果的前几页已经变成了各种广告和百家号的天下,而真正有价值的搜索结果屈指可数,消息一出,舆论震撼,口诛笔伐之声一时又起。作为BAT中最名不副实的巨头,百度在舆论场上再一次被打成了蚂蜂窝。

不过,在笔者看来,这篇文章与其说是得出了什么新结论,不如说是说出了很多人此前有所察觉,但又未曾表露出来的心里话而已。然而问题在于,解构和批斗总是容易的,只要肆意的发泄自己的情绪就可以,而建构和寻找替代方案却是困难的,因为这需要静下心来集中注意力去思考一个问题:既然百度搜索引擎的结果是不准确的,那我们应该怎么办?对此,笔者决定为大家推出一个分为上下两篇的系列文章,本文为上篇,分为三部分。鉴于文章略长,各位读者可以直接翻到自己感兴趣的部分进行阅读:

1、从百家号到买热搜:被人为操纵的互联网

2、互联网治下的个体,或傀儡师牵线的玩偶

3、基于区块链的分布式网络:自由民的最后岛屿一、从百家号到买热搜:被人为操纵的互联网我们还是回到文章开头的那个问题上。在很多人看来,既然百度不好用,那简单粗暴的就把它推下神坛、另立新王不就得了?但问题在于:其他的中文搜索引擎——比如说搜狗这种通用的搜索引擎;或是像微博这种站内的搜索引擎,其结果就会更客观吗?答案恐怕是不尽然的。举个最简单的例子:众所周知,现在的微信公众号已经汇集了很多有质量的内容,而要搜索微信公众号里有价值的内容,最简单的方式有两种:使用微信内置的引擎搜索、或是使用搜狗的“微信搜索”功能。而当你想要根据几个关键词搜索一些有价值的内容、甚至是你之前已经看过的一些高点击量文章时,猜猜结果会怎么样?没错,各位读者应该有预感了——你们在这些搜索引擎中,经常是搜索不到这个内容的,甚至在某些极端的情况下,你把这个文章的全部题目都输入进去,排名前几位的结果可能都不是你想要的。

在很多朋友看来,这个结果可能是比较出人意外。然而,作为一个经常会在微信公众号体系内搜索信息的人,笔者可以告诉大家:这都是的的确确存在的现实。为什么会出现这样的情况?原因大体无非两种:一是搜索引擎客观实力不行,没法抓取到更符合搜索关键词的结果。不过结合现实情况来看,此种情况的可能性较小,毕竟站内信息抓取不比站外,不存在因为利益主体相左而屏蔽信息接口的问题。那这样一来,就剩下另外一种非常可怕的可能性了:那就是搜索引擎在有意为之。

事实上,作为一名经常要从互联网上搜索并获取大量信息的研究员,笔者早就对中文互联网匮乏的含金量感到万分恼火了。然而,就像币圈经常说的那句话一样——“跌了90%,没想到还能跌90%”,在最近的一两年之内,笔者开始发现:当你以为中文搜索引擎的底线已经到了地板的时候,没想到地板下面还有地下室。如果说早先的中文搜索引擎还仅仅是因为客观技术问题,没法把你引导向有价值的信息之上,那现在只是开始公然主观作恶,直接把垃圾信息推送到你的面前。

举个最简单的例子。相信很多读者应该都注意到了一件事:那就是无论是百度搜索、搜狗搜索、还是微博搜索,在这些搜索引擎的搜索框附近,动不动就躺着一堆诡异无比的所谓“搜索热词”,这里姑且不提这些搜索热词的无聊程度到了何等登峰造极的地步、以至于对分散人们宝贵的注意力作出了多么巨大的贡献,只说一点——这些所谓的“热搜”,是真的有客观点击量在支撑、被动升上热搜榜,还是只不过是受到既得利益集团的主观操作,主动被抬上热搜榜的?

事实上,只要稍作观察便不难发现,这些所谓的热搜,很多时候就是由人来主动调整的。在笔者写这篇文章的2月5日,正值中国农历春节的大年初一,在这样的情况之下,搜狗微信搜索的热词里,竟然没有一条跟春节相关的内容(见下图),要知道,此时距离春晚已经过去了将近20个小时,微信公众号里怎么可能连跟春晚、甚至是春节搭一点边儿的热文都没有?而微博搜索和百度搜索虽然都有一些跟春节相关的内容,但是彼此之间也是没有任何一条重叠的消息,难道百度的用户和微博的用户多关注点完全不存在交集?这都是通过常理很难说得通的。由此我们基本可以判断,所谓的“搜索热词”其实真的就是如同坊间所说的“买热搜”一样,是被人所主观操纵的。

图:2019年2月5日,搜狗微信、百度、微博的各自搜索热点

版权所有:http://www.139770.com 转载请注明出处