近来关于“阿里巴巴屏蔽百度蜘蛛事件”抄的沸沸扬扬,大家众说风云,但是比较统一的说法是“百度进军C2C市场,通过其巨大的中文搜索引擎资源占有率,很有可能借助小小的蜘蛛,获取大量的现有资料和数据,快速进军C2C市场!”
    作为电子商务的热爱者和搜索引擎优化的爱好者,杰米想引用一句《武林外传》的经典台词来评论这次屏蔽蜘蛛的事件利弊——“跟蜘蛛过不去,就是和搜索引擎过不去,跟搜索引擎过不去,就是和广大网友过不去,跟广大网友过不去,就是跟钱过不去,你敢跟钱过不去吗?…… ”
    众所周知,搜索引擎是互联网发展的核心力量,同时,未来的电子商务更趋向于先进的搜索引擎技术,方便人们在巨大的互联网信息海洋里获取自己想要的信息。 可以准确的推断,未来的搜索引擎发展方向是搜索专业化,按照各种分类将搜索细分,形成更为专业的搜索。例如目前流行的BT搜索,就是将搜索定位在BT相关的内容;百度,谷歌的图片搜索,音乐搜索,新闻搜索等等都是搜索细分的表现。
    可以说,互联网的绝大部分信息都是在靠各种各样的搜索在疏导,网络使用者也是通过搜索引擎这个导航台在进行操作。 搜索引擎在互联网中占了主导的地位。
    我们引用《阿里巴巴商人论坛》的一段话——“淘宝“封”百度,为什么“封”要加个引号,事实上,我恰恰认为这是对互联网“奴性”在说不。所谓“奴性”,就是明明你自己辛辛苦苦积累的数据被别人一个小小爬虫就不劳而获了,你还要巴巴地求着人家来接受你的免费贡献。百度在搜索领域的市场占有率已经超过了淘宝在C2C电子商务的占有率,而搜索是一个比电子商务大得多的领域。正如不作恶的GOOGLE正在不断威胁着众多业内人士的生命线的危机一样,一个妄图什么应用都必须先通过搜索来引入的网站,对于整体行业的发展是不利的。所以,竞争就是要打破垄断,这种平衡是不能靠所谓的“不作恶”的企业自律来实现的,况且,中国的百度并未把搜索老大的“不作恶”原则当回事”
    简单分析一下蜘蛛的工作原理,搜索引擎利用蜘蛛(一种模拟网页访问的程序)收集和整理互联网站的各种数据,并将这些数据按照某些特定的规则进行排序,当互联网用户通过关键字进行搜索时,搜索引擎会将蜘蛛收集整理的数据根据关键字进行塞选,并将结果反馈给使用者,这就是最简单的搜索引擎工作原理。当然真正的搜索引擎后台工作要复杂的多,仅关键字排名变量就有上亿个。
    阿里屏蔽了百度的蜘蛛,其实也就是将阿里的淘宝网站所有网页,数据从百度的数据库中删除,简单的理解为,当客户搜索某个产品的时候,即使淘宝里有,可是在百度搜索结果中却没有淘宝的产品!淘宝从此丢失了一个被客户找到的机会!我不确定每天阿里有多少客人是从百度搜索引擎来的,但是我可以肯定这个量是非常巨大的,至少占阿里每天访问总量的15%-35%之间,甚至更高!也就是说,屏蔽百度后,阿里每天要丢失1-3成的客户。
    我们再分析一下阿里担心的问题“百度利用蜘蛛,收集阿里的数据和资料”。大家都知道,互联网是一个资源共享的世界,互联网的信息共享率在90%以上。除了个人隐私及加密信息,互联网的信息可以说只要你能看到的,都是免费共享的。稍微有些互联网技术的程序员都知道,采集器可以采集任何你可以看的到的数据(我们姑且不去讨论采集器引起的版权和合法性)但是光这一点就可以说明,如果有人想要整个网站的数据资料,不是屏蔽蜘蛛就可以做的到的。难道阿里会不晓得这个技术吗?不,一定不会的!
    回到我们最初的评论内容:“跟蜘蛛过不去,就是和搜索引擎过不去,跟搜索引擎过不去,就是和广大网友过不去,跟广大网友过不去,就是跟钱过不去,你敢跟钱过不去吗?…… ” 作为一个电子商务的老大,应该努力的去创造,而不应该担心被模仿,甚至被超越!就这件事情,个人认为应该努力和百度拉好关系,互相配合,最大化的建立起自己的市场占有率(虽然本人并不喜欢百度那种专横霸道的经营策略),而不是应该庸人自扰,闭门造车!
策划联盟 - SEO优化技术群  原创文章,转载请注明! |
|