新浪微博笔试题:找出共有2个以上标签的用户对

题目:给定sina微博的全部用户(1亿以上)和标签(uniq的标签30万左右)的关系, 系统找出共有2个或以上标签的用户对,并给出这些标签是哪些。

input:userid,taglist output:userid,userid,con-taglist (sizeof(con_taglist)>=2)

数据示例

输入

AA,体育 新闻清华 百年校庆 BB,娱乐 八卦清华 新闻 CC,体育 娱乐新闻 DD,八卦 新闻娱乐

输出

AA,BB 清华 新闻 AA,CC 体育 新闻 BB,CC 娱乐 新闻 BB,DD 娱乐 八卦 新闻 CC,DD 娱乐 新闻

接下来就一起来想办法解决上面的难题。基于对于新浪微博的了解,以下内容可能会在实现中起到一些作用:

目前新浪微博每个用户最多可设置标签10个; 目前有相当数量的用户是没有设置标签的。

解决问题思路:(自己整理的笨办法,自己能力有限暂时想不到更好的方案)

删除没有标签的用户数据,这一操作可以先把一部分不需要纳入分析的数据给排除掉。具体数量未知。 建立标签到用户的倒排索引。从以上数据上来看,平均每个标签用户对应的用户ID链要小于10^8*10/30^4 = 3000,但同时要考虑热门标签的ID数量会非常的大。 去除倒排索引后只有一个用户数的标签,这个估计可以去除的量很少。 对于删除后没有标签的数据按ID大小进行排序。 对于用户依次取其标签,查找倒排索引,找到共有用户。(只查找倒排索引中比用户ID比自己大的用户)

基于以上的想法,考虑的新浪微博应该采用了 NOSQL存储,我们先假定具体数据格式如下:

{“userid”:123,”taglist”:[“体育”,”新闻”,”清华”,”百年校庆”]} {“userid”:124,”taglist”:[“娱乐”,”新闻”,”清华”,”八卦”]} {“userid”:125,”taglist”:[“娱乐”,”新闻”,”体育”]} {“userid”:126,”taglist”:[“娱乐”,”新闻”,”八卦”]}

就上面的一些数据我尝试了下将上面的数据进行倒排索引。具体的Python实现方法(代码写的比较丑,对于python怎么使用MapReduce):

# […]

里外都是新模样,芬兰航空带你走进自然

作为世界上历史最为悠久的航空公司之一,“现代化”一直是芬兰航空(FINNAIR)的最大特色。最近,他们把芬兰著名设计公司 Marimekko 的古典印花图案融入到两架飞机的机身及舱内用品的设计上,其中一架往返于赫尔辛基和亚洲目的地国家的空客 A340 已经投入使用,另一家飞机要到明年才会加入到飞行阵营当中(从 2013 年开始,芬航的所有航班都将使用 Marimekko 所设计的餐具,包括茶壶、茶杯、盘子和餐巾等)。

▲机身图案为 Marimekko 的经典印花图案——罂粟花,来自艺术家 Maija Isola。

▲咖啡杯上的蓝色圆块是 Marimekko 经典的 Kivet 图案。

此次 Marimekko 所设计的图形均比较简单,仿佛儿童的无心涂鸦。设计师说,旅行到新鲜的国家往往首先注意到的是飞机舷窗外的自然风光,在飞机下行时就可感受到这片陆地的独有魅力。因此在设计过程中,他们极力想要抓住那些代表芬兰最有特点的自然景致的元素,如流动的泉水、冷峻的岩石,在颜色选择方面,则以初春的新绿和潺潺流水的碧蓝为代表。并且,桌布上的条纹和马克杯上绿色线条,都能让人想到北欧大陆上静谧的河流以及广袤的针叶林。

▲给茶壶配上木质手柄,是在向传统的芬兰设计表达敬意。

由于飞机机舱情况特殊,设计师还考虑到了轻便、节省空间的问题。此次呈现的设计除了以上我们看到的餐具系列,还包括空乘人员的围裙、飞机枕套和被套等,我们可以在下面这个视频中看到,还能顺便领略芬兰美丽的风光哦。

[tudou id=”lcqpaudzMU8″ w=”500″]

责任编辑:夏盈年

[…]

Ubuntu桌面生存指南 (3) — 构建Ubuntu系统基础设施

Ubuntu系统的基础设施

任何一个高可用的操作系统,必须解决以下几个重要的问题:

系统易于安装升级 软件丰富,完备 便捷的系统备份与恢复 硬件驱动完善 突破墙的封锁(中国特色问题)

这一节中,我们将讨论从头开始搭建一个基础设施完善的 Ubuntu 系统。主要包括基于 Ubuntu 系统的安装,分区方案,显卡驱动安装,翻墙相关的一些技巧和同步软件(Dropbox)等基础性软件的安装方法。在夯实了这些基础之后,我们也为未来的系统备份,恢复做好了准备,提高了系统的图形处理性能,解决了在不同机器,不同系统间的文件同步问题,同时突破墙的封锁,进一步方便我们日常的工作学习,极大提升系统的可用性和灾难恢复能力。

从U盘安装系统

上一篇 博客中我们提到过,虽然 Ubuntu 的发行安装方式众多,我们仍然推荐从硬盘开始安装。另一方面比起光盘,相信很多同学也了解U盘的优势:易于携带,保存,复制。这里不再敷陈,我们就从制作启动U盘说起。

1. 下载 Ubuntu ISO 文件

访问 Ubuntu 的 官方下载 页面,选择相应版本。一般而言它的版本有桌面版,服务器版,32位,64位,LTS,非LTS之分。所谓 LTS(Long Term Support)指的是长时间支持版本,并不是每一个新版本的 Ubuntu 都是 LTS 版本,譬如,最新的 12.10 版本就不是 LTS 版本,12.04 就是 LTS 版本,12.04 之前的 LTS 版本要追溯到2010年4月发布的 10.04,同时主版本号代表发布的年份,次版本号代表发布的月份,例如:12.04表示2012年4月发布。一般来说,推荐下载最近的 LTS 版本会得到更好的官方支援。这里我们推荐安装 12.04 的64位桌面版(命名方式:ubuntu-12.04.1-desktop-amd64.iso),官方支持长达5年之久,基本上已经超过了用户当前硬件的预期使用寿命,也就是说你在换下一台PC之前无需更换操作系统。如果官方站点的下载速度较慢,你也可以搜索国内的一些镜像网站加速下载过程。譬如 网易镜像

2. 从 Windows 制作启动U盘

在 […]

国航大企业病

不断接到朋友的短信和网友邮件,要求谈一谈新浪微博某大V和国航的冲突一事。其实,事情很简单,也不至于演化到后来那么激烈冲突的程度。我们先回放一下事件:

时间:2012年10月地点:普吉岛航程:普吉—北京承运人:中国国际航空公司事由:某旅客一家4人通过旅行社购买了经济舱优惠折扣机票,该机票不能退票、改签。4人中有一人为老年人,为了避免旅途劳顿,额外为她购买了一张公务舱机票。以上票务问题,得到国航销售人员确认。在普吉办理登机手续时,当地机场地面服务人员更换了四张经济舱登机牌。登机之后,国航乘务长拒绝老人乘坐公务舱,理由是没有对应座位的登机牌。旅客要求:1)由于4人购买了5张票,要求实际使用5个座位,并且要求经济舱4个座位连排,以便休息。2)老人使用公务舱座位。

分析:

航空公司直销点以及代销合作方都使用中航信提供的订票系统,在这个系统内应该不允许同一航班同一身份证拥有两个订票记录。因此,销售人员接到一个人买两张票的申请,内心一阵狂喜之后,会果断卖掉两张票,并且承诺一切都OK。怎么个OK法呢?因为对方提出要4张经济舱的连排座位,那么他首先会在订票系统中按照标准程序出4张经济舱的票。事实上,由于这套机票在出行前就已经订好,他连这个步骤都省略了。从实际情况看,他应该是这样操作的。然后,在他的系统操作权限之内,他还能做的事情只有一件:保留公务舱的一个座位,把它标记为已经被订。最后,他需要给在普吉的国航驻站经理发一个传真或者打一个电话,通知对方有这样一个特别的服务,请他在运营中注意一下。

销售环节完成,航班运行进入地面服务阶段。我不清楚国航是否在普吉有大量外派人员,足够租用机场柜台开展自己的地面值机服务。一般情况下,这种服务会被外包给当地的机场地面服务公司。普吉的地面服务人员拿到护照,对照系统内的订票记录,给出了4张经济舱的票。这时,给出了4个连排座位,说明该旅客的要求1)已经准确传递给了普吉机场地面服务人员,并且得到了满足。但是,随后意外就准时发生了:

国航销售人员标记为已订的公务舱座位,在达到时限却没有人更换登机牌,系统自动解除了锁定保护。普吉的另一个销售人员高高兴兴地把这张机票卖给了另外一个急等机票的有钱人。或者,两个有钱人在更换登机牌的时候,要求坐在一起。地面服务人员发现没有连排的公务舱座位了,但是有一个被锁定但是未办理登机牌的座位。于是,出于服务的热忱,他解除了这张票的锁定,为两个有钱人办好了连排座位。并且,在心底里准备好了一堆解释,等待那个其实永远不会到来公务舱客人。

地面服务阶段结束,登机开始。乘务长接到一个要求,某位经济舱的旅客要求坐到公务舱去,而她没有公务舱登机牌,只有一张经济舱登机牌,无法证明她购买了公务舱机票。乘务长对照普吉机场地面提供的舱单,发现公务舱的客人已经齐了,不存在少一人的问题。因此,乘务长拒绝了这一要求,冲突发生。随后,另外一名乘务员联系地面,确认了订票的事实,问题最终得到解决,要求2)得到满足。

问题出在哪里?由于销售—值机—客舱服务有三个环节,当旅客在第一环节提出特殊服务要求的时候,出于经济利益考虑,销售环节一口吃下了需求。但是,随后的信息传递在衔接环节上发生了缺失。很明显,要么是国航销售没有通知到国航驻普吉的运营经理,要么是运营经理只通知了普吉机场值机要连排座位,却忘记及时通知飞行机组预留公务舱座位。由于有乘务员联系地面,使得问题迅速解决的这一情况,可以基本推断是后一种情形。

冲突的焦点在于乘务长的处理方式。一方面她太笃信自己的经验和数据,造成了傲慢自大的负面影响。另一方面,很可能她是为了避免一个小麻烦而造成了一个大麻烦—由于飞机是停靠在普吉,联系国航地面人员不便。如果要查证消息,就势必要求她进入驾驶舱,请求机长用通讯器呼叫普吉地面签派人员,请他们去找国航普吉运营经理。或者,启用随机配发的公用手机,查询国航普吉运营经理电话,通过国际长途沟通(如果国航有这一飞行保障政策的话)。相比之下,拒绝这个很大程度上可能是非份的要求,更为节省时间精力,避免许多沟通上的口舌。

无论是上述分析的哪一种情况,我们都可以看到国航拥有一切大型企业的通病。部门分工非常细致,销售可以提供如此复杂的售票计划就是证明。部门和部门之间信息传递不畅,不能确保连续环节上的信息有效、完整到达,人员之间也缺乏主动沟通的意识。人员专业程度高,但是服务意识淡漠,相信统计报表和数据,呆板执行标准程序,但是漠视具体的用户需求。

而程序从来都不是万能的。例如这个案例里的特殊票务需求,如果可以进入头一天普吉机场国航保障人员下午的准备会,那么可能会处理得好很多,旅客也满意。但是,这种事情又太小,以至于不能上会。在这种会议上,会讨论运输担架旅客拆座位的问题,会讨论飞机货舱运输棺材和骨灰的问题。类似这样大的议题,大企业里不乏精明的头脑,妥帖的服务。要知道,每年飞机运输的棺材和尸体不在少数,但是为什么没有旅客发现?因为总是会有人在会议结束时提议,一定要给棺材包上蒙布,以免其它旅客看到之后有心理障碍。而这种提议会立即被采纳,而且不折不扣地执行下去。

因此,大企业病的员工是不愿意轻易放弃标准程序,额外做一点信息沟通工作的。因为这对于他们来说,不属于自己职责范围之内的事情,属于额外的麻烦。结果就是,旅客唯一的选择就是升级冲突。当冲突升级至大麻烦的时候,非标准化的应急程序启动,事情可以很快得以解决,但是其中的经验教训不会得到反馈,也不会作为运营经验沉淀下来。下一次,类似的事情还是可能发生,不过,不在我当班的航班上,不是么?由它去吧!

最后,那个主动解决了这一问题的普通乘务员的命运让人担忧。因为在管理层级上来说,她的地位低于乘务长,乘务长是本次航班客舱服务的最高负责人。她没有得到授权私自采取了行动,得出了和乘务长意志相悖的结论,虽然处理好了这件事情,但是会造成人际关系上的阴影。尤其是在大V把她和乘务长作为鲜明对比之后,也许她出于好心去做的事情会成为她个人职业生涯麻烦的开始。大企业会驱逐和边缘化所有不按章操作和不尊重层级管理的员工,这也是它们为什么人味越来越少的原因。好人,都是被表扬死的。

可悲的百度算法机制

最近似乎已经很少看到有关于SEO的相关文章了,这是不是印证了《SEO已死》这篇文章。可能,也许在中国,真正的SEO离死真的并不遥远了。

背景

最近有个朋友频频跟我抱怨,网站无法被百度正常收录,几个关键词的排名也是好几个月没有动过了。这位朋友是个专心做内容的家伙,因为时常被我灌输 “内容为王”的理念,而他网站的相关行业客户对象一般都是年龄较大的互联网用户,在分享传播和外链上,几乎不能指望靠优秀的内容达成,所以在外链规模上十分有限。

另外,由于曾经因为有意识的购买外链而被搜索引擎惩罚,他也并不太敢于使用链接工厂的那些服务,只是花钱做了十来个所谓百度权重高大7的友链。毕竟行业不是很主流,他觉得也差不多了,其他精力都放在内容上了。

在这样“曲高和寡” 的作风下,有经验的朋友已经猜到了结局:那就百度收录极差,谷歌收录极好。但谷歌带来的流量实在太过坑爹,基本可以无视,甚至360搜索都比谷歌多。

这位老兄憋了两个月,终于忍不住问我:是不是还是要多搞点外链啥的?我看他那副惨样,终于长叹一声:搞吧。

回忆

以上这些事儿,如果发生在两三年前,我的建议肯定是——“酌情并有序地增加外链,避免作弊嫌疑”,如果发生在四五年前,我的建议肯定是——“给我义无反顾地搞外链,外链为皇!”。可是这已经是2012年的事儿了。

在这几年,对于那些平凡的网站来说,想得到百度的稳定排名真的不太容易。

我接触的数十位上海本地站长的一致公认:百度近一两年在排名方面存在严重的欺软怕硬现象。也就是说,普通网站不管是在内在外进行的各种优化都不见得会正常影响排名,甚至仿佛是随机抽取的,你基本得不到任何规律可言。你试试这招也没用,试试那招也没用,或者最多顶个几天用。总结下来,难道真得像百度所说,只要琢磨好《百度站长指南》,并把内功做好就行了?

在我遇到的企业级客户中,这种现象更加普遍。多个企业在没有进行任何黑帽优化的情况下,网站排名经常大幅波动,甚至持续性倒退。而在谷歌这里,却在收录方面得到了明显提升。而对于不少大型网站或者“重要站点”,即使啥都不干,排名与收录都很稳健,即使那网站做的一塌糊涂。

看起来这似乎是好事儿。搜索引擎的游戏规则那么神鬼莫测,是不是说明百度的技术已经真正超过了谷歌,“更懂中文”,能够更多靠内容和其他综合因素来判定结果,毕竟不管怎么说,百度的搜索体验不说最好,但也并不差。

现实

但事实并非如此,百度看似高明的算法变化与不留情面的生杀予夺,只是一件很可笑的事情,因为一切都没有改变。

让我们来2012年10月27日凌晨的一个例子,这是我观察了不少天的一个网站:

上图底部的那家网站是出现在百度搜索“平板电脑”这个关键词的首页自然排名中,排除竞价投放因素,它的自然排名居然仅次于中关村在线的开放接口、百度图片、百度百科,位于第四位。在27日下午再次核实,它依然排在前五,首页10个自然排名除了它全部出自中关村在线、Pconline、百度自有产品、泡泡网。如果这种事发生在类似“卢森堡移民”这一类的冷门领域倒还可以理解,但是在微软Surface、Ipad Mini、Nexus 7二代竞相登场的金秋十月尚能做到这些,这到底是哪一家平板厂商?

讽刺的是,百度居然在搜索结果中该网站标题的下方增加了这么一句话:

百度提示您:该页面可能因黑客侵入而存在安全风险

点击该信息,显示结果其实就是有大量的电脑管家用户举报它为“欺诈”型网站。对该网站WHOIS用户信息和IP进行了追踪,发现该平板电脑销售网站的持有方是一家深圳的山寨厂。令人惊讶的是,他还不是一家卖数码产品的,而是卖生物制品的公司。根据同IP下反查出的16个网站显示,这家公司主营的产品基本都是女性减肥、美容类产品,例如左旋肉碱、木瓜汤之流。

写到这里,懂行的圈内人都会会心的一笑。

再探

那我们来看看这个网站做的如何。

这个网站做的中规中矩,算不上精致,但也并不难看。但仅就百度官方提供的“SEO建议”中涉及的那几项站内优化要求,我认为测试总分应不会超过70 分,甚至堪堪及格。无论是JS位置、ALT信息还是DIV+CSS的要求,都并不是那么无懈可击。实际上,这顶多算是一个Landing Page型的销售页面,根本就没有代码层面SEO的基本思想在里面。

这让文首提到的那位老兄情何以堪,让那些手写sitemap的站长们情何以堪。

那么这家网站是如何做到这些的?而百度又是为何能让这么一个被频频举报为欺诈且没有付过一分钱给自己(这点清廉我们还是相信的)的山寨平板销售网站骑在联想、华为、京东、当当头上?这如果不是策略,难道是技术和算法上的原因?

可悲

我对该网站服务器上的10多个兄弟网站进行了调查,其中居然只有一个PR=0,其他网站PR都有2-3,要知道,这些可都是单页型的销售类网站,甚至不能叫网站,只是一个页面。

谷歌的PR说明不了太大问题,我们看看它的反链:

我的老天诶,11万多的百度反链。当然,由于雅虎退出搜索阵线,我没有找到特别好用的外链和锚文本检索工具,这11万中一定也包括很多无效的链接或者文本链接,同时,域名中的英文关键词与品牌标题一致也会增加反链统计数。然而毫无疑问,我们已经找到了答案。收录24,反链11万。

我记得上一个给我类似感觉的网站,叫做“麦包包”,高达65万的反链,连淘宝都甘拜下风。

仔细查看这些反链,我们发现了一位极为高明的SEO外链老手的痕迹,而且几乎都是新闻站的软文。由于软文本身存在被转载的可能,大量增加了 domain在文本层面上的曝光几率。这也侧面证明,非锚文本链接对企业主站的意义,也一定程度上证实这样一句话:“只有几个人表扬你,有人会不服;但是成千上万人表扬你,不服也得服。”

百度无疑是服了,这就是百度的算法吗?在这样热门的关键词排名中,在网站被举报欺诈的情况下依然给出这么显赫的排名?这让那些因为相信百度而购买了接近2000元却用着MTK6573芯片的垃圾无售后山寨平板的普通用户作如何想法?

真是可悲,和五年前一样,其实什么都没有变。大道至简,唯“多”不破。

作者:Shepherd,原文链接。

本栏目内容来源互联网,“网络文摘”频道采用创作共用版权协议! | 本文地址 :http://lusongsong.com/inf o/post/277.html | 我来说两句?

继续阅读《可悲的百度算法机制》的全文内容…

相关文章: 我为什么用Google搜索而不用百度 (2012-10-29 9:25:19) […]

我为什么用Google搜索而不用百度

互联网是浩瀚无底的,想要挖掘这个信息宝藏,就必须使用搜索引擎,比如百度、Google谷歌等。你使用什么搜索引擎呢?对于我来讲,不论搜索什么资料,我都会优先使用Google.

相反用百度搜索的时候并不多,我为什么偏爱Google而不用百度呢?这当然是有原因的,尤其是结合个人的具体情况。

反应速度

身在墙外,使用谷歌的速度当然会快很多——想想谷歌在全球各地的数据中心之多(比利时就有一个数据中心)就能明白为什么在大陆以外用百度会慢很多。当然这一点是与我暂时所处的位置有关,如果我处在伟大的祖国,可能也要享受那动不动“连接重置”的待遇,也许这就是某些人的“高明”之处,我不是不让你用谷歌,而是让你感受到很“难用”,进而使用民族产品——“百度一下,你就知道”。

外文资料

百度搜索英文等外文信息几乎是小儿科,收录的信息量很少。搜索出来的结果也没有什么相关性,毕竟这是一家以中文信息为主要对象的搜索引擎,人家百度自己都说了:百度更懂中文。而作为一个理工科生,搜索英文是必须的,就算平时搜索普通的信息,英文信息也是大把大把的,详细又可靠。再专业一点,作为一名科研人员,Google的学术搜索更是必需品。

人工干预

听说百度搜索出来的结果有人工干预成分。具体情况如何,我想几乎没有外人知道。但我能感觉到百度搜索出来的结果很不稳定,今天是这几个结果,过几天那几个结果可能就无影无踪了。互联网变化是天天有,但并不见得优秀内容天天产生,尤其是面对搜索出来的结果明显不符合用户要求的时候。

还有一个问题就是金钱的因素,如果任何搜索结果都可以用钱说了算,这样的搜索结果必定会失去中立性。进而产生垃圾信息,垃圾信息就算再多速度再快,也并不是人们需要的。

商业公司应该以赚钱为目的,但如果不能提供给用户合理的服务或产品,这就是赚“恶毒”的钱。就算不涉及到“根据相关法律法规和政策,部分搜索结果未予显示”的问题,在搜索中立上,谷歌至少在目前仍然遵守“不作恶”。

界面美观

谷歌这种公司的产品都很简洁,但简洁并不代表可以不漂亮。看看谷歌的搜索结果界面,再和百度的对比一下,就自然能感觉出来了。我很奇怪百度为什么就不能“山寨”一下这个界面呢?把结果居中一点难道不更好看吗?该山寨的时候不山寨,不该复制的时候复制。

集成服务

谷歌的服务太多了,Gmail——邮箱中的战斗机, Google Calendar, Chrome——最好用的浏览器(没有之一),Google Maps, Google Reader……这些服务都非常优秀,并且免费。百度呢?百度知道?我不知道。当然这一点在国内要正常使用也不太顺利,这也验证了那句话:不被墙的互联网产品不能证明是好产品。

不用百度的理由显然有很多,就如同使用百度的理由也很多,但如果谷歌Google不够优秀就难以解释:虽然国内朋友常常遇到谷歌Google被重置,但仍坚持使用谷歌的原因——这与崇洋媚外真的没有关系。

顺便提一下:由于众所周知的未知原因,在国内网络环境下建议使用谷歌复原:http://www.google.com.im,可能会有较好的体验,要想顺利使用Google谷歌还有更多的方法,具体的技术细节,请自行Google之。

文章来源:土木坛子博客

怎样正确地欣赏左小祖咒和鸟叔

一位叫做“Lisa酱”的小朋友对我的微信公共帐号提问说:

“菜头〜我记得你很喜欢左小祖咒是吧?我刚刚听了他的《我不能悲伤地坐在你身旁》,怎么说呢,我对这种好像坐在大排档边喝酒边讲故事的声调不是很感兴趣,可是,我很好奇啊,好奇你为什么会那么喜欢,你可以用你介绍美食的方式给我介绍一下吗?普里斯〜”

这是一个狠高端的问题,随时可能会造成一个人的三观委地节操粉碎,必须加以严肃回答。为此,我专门开一贴讨论一下怎样才能正确地欣赏左小祖咒和鸟叔(PSY)。

面对左小祖咒这样一种人,你不可以用以往的经验试图把他归类,或者纳入某种模式。原因很简单,这厮唱歌跑调,驴嘶马鸣一般,根本无法归入过去已知的各类流行音乐歌手类型。当然,简便方法是认为左小祖咒就是在装逼,好在市场上赚钱。这里你自己选吧,判断为装逼,我们就在这个自然段道别,这事就告了一段落好了。怎样?

没走?没走就是一个好的开端。我猜想不走的理由是好奇,想知道我接着怎么说左小。这其实是不对的,你继续看到这一段,深层次的原因是你对左小祖咒好奇,而不是对我怎么讲解好奇。因为你遇见一件你无法理解的事情,又不愿意简单地搁置到一边,想了解一下究竟。这是一个好的开端,试图理解什么东西的时候,一定要有好奇心,最好还有一些良善的意愿。

现在你面前有一堆关于左小祖咒的现象,比如他的视频,他的微博,可能还有他的书。所有这一切,都是左小祖咒的现在。而所有这些光怪陆离的显现,只是增加了你的疑惑,觉得无法理解,距离问题的实质很遥远。那么,你是不是应该试着了解一下这个人?在网上你可以查一下这个人的百科资料,例如左小祖咒的大事年表。

大事年表是数据和一堆句子,看不明白还是看不明白。我帮你解读一下吧:

1、 表里没有写的是,左小祖咒最早是空军,在某个空军场站医院的卫生所做男护士,主要工作是割包皮。2、 表里可以看出,左小祖咒是从2008年起获得广泛认可,现在是他收割的季节。而你要注意的是1993年起,他就在北京东村活动。也就是说,割完了所有同事的包皮之后,左小祖咒退役,有19年时间在当代艺术圈里混,而且是从最底层混起。3、 表里的1995年,左小祖咒有一个当代艺术作品,叫做《为无名山增高一米》。那是一次行为艺术,可以去找一下当时的图片来看看。从这个作品你大概可以明白,为什么不能把他当作是流行歌手。4、 表里的1999年,左小祖咒参加威尼斯双年展。这里你可以做一个判断,左小祖咒是不是神经病,或者装逼犯,还是他真的有点什么东西,以至于在艺术圈里获得了一点认可。5、 如果你暂停一下,跳出去了解了一下中国当代艺术,尤其是几位著名当代艺术画家。请你再去看看左小祖咒2007年的作品《我也爱当代艺术》,那简直是恶毒到了浑身都是毒汁。6、 最后,看一下2006年。左小祖咒和王土的短片《弟弟》,摄影作品《880》在新加坡国家艺术中心展出。也就是说,这个牲口除了玩音乐、行为艺术之外,还染指电影和摄影。7、 这张表里没有写的是,左小祖咒一直在写诗。

一个人折腾了19年,如果你把他这19年的折腾史过一遍,无论理解赞同欣赏与否,你会承认一点:这个人要比看起来复杂得多,不仅仅是唱歌跑调那么简单。把他视为一个哗众取宠的跑调歌手,起码是认识太片面,不够尊重这19年的时光。也许你会在这19年的折腾里看出一条脉络来,或者你什么都看不出来,不明白他究竟在为什么而折腾,这没关系。在了解左小祖咒个人发展历程之后,我们来看看他最早的成名曲《我不能孤单地坐在你身旁》,不要开音响,不要戴耳机,我们过一遍词就好了:

那杆枪被你扔了我也没有说我用不上那玩意儿我需要它去杀某个人在昨天我不能悲伤地坐在你身旁当我推开那扇门想看看永恒荣光的状景那没有他们说的实用阶梯然而我又不能悲伤地坐在你身旁我不能悲伤地坐在你身旁

那把吉他你拿回来了你也没有说我用不上那玩意儿我需要它来歌唱在今天我不能悲伤地坐在你身旁在我走出那扇门撕下某本书的二百五十二页它用黑色镶金这般地写着Hey 我不能悲伤地坐在你身旁

有没有觉得这其实是一首不错的诗?永恒荣光、状景、实用阶梯、那扇门、黑色镶金,看不大懂,但是觉得有点意思,是这样么?觉得可以有很多种解读方式,是这样么?那不是很好么?左小祖咒给了你一个小玩具,随便你怎么玩,反正不会坏,而且琢磨一下,有点小意思,这是多好玩的事情啊。

然后,然后你就可以彻底忘记了这件事情。该看韩剧看韩剧去,该温书温书去,该弹钢琴写PPT该干嘛干嘛去。也许很快,也许要很久。有一天,某个下午,或者是黄昏,你偶然听到左小那把破锣嗓子在什么角落里唱“我不能,悲伤地坐在你身旁”,突然有点小感动,觉得心头被什么东西轻轻拽了一下。那一刻,你不再在意他的跑调,你只是沉浸在音乐里,那种破锣声线带着一种缓慢的,迟钝的,粗糙的,但是又非常坚决的东西悄然降临,你突然被悲伤四面包围,想说点什么又说不出来,那你就可以欣赏左小祖咒了。你会喜欢他的。

感性了两千多字,如果用理性一点的说法,其实一段话就足够了:不要用既往的经验试图类比、归纳你所不理解的东西。如果事物的表现呈现出你无法理解的对立冲突,那么试着想一下显现之下的部分究竟是什么?因为这种不可理喻的冲突本身,很可能是要让你放弃继往的经验,换一个角度欣赏事物。喜欢左小祖咒的人没有一个在意他跑调不跑调的,相反的,如果他不跑调了,大家可能会觉得他的作品要少很多力度和趣味。

回到最早的一个选择上来,左小祖咒是不是在靠装逼搏出位吸引眼球?公平地讲,应该这么说:不单是左小祖咒,有一批当代艺术家都是非常精明的家伙。他们了解公众的心态,知道媒体需要什么,总是能够找到获得市场认可的表现方式。今天回过头去看,左小祖咒当年创造中国最高单价CD的记录,你可以说他是装逼,但是他的确用这种方式找到了他的铁粉。没有这种热闹,他在人群中就无法被潜在的支持者发现。江湖那么大,人那么多,眼球如此分散。要吸引人就得跟卖大力丸的师傅一样,随时表演胸口碎大石。问题的关键在于:所有当街胸口碎大石的哥们,不都是卖狗皮膏药的。太极张三丰再世,他也得在十字街头连碎十块大石,否则人们认不得他。

最后,可以类比的是《江南Style》的鸟叔。继Google老总施密特,美国一帮电视主持人和鸟叔大跳骑马舞之后,联合国秘书长潘基文老师也亲切接见鸟叔,一起大跳而特跳。于是有人问:鸟叔的这首破歌有那么好么?究竟有什么好?这个问题问得不对,施密特喜欢《江南Style》吗?未必,随后的新闻是鸟叔代言Google TV进军韩国。潘基文喜欢吗?哦,对不起,忘记了,潘基文是韩国人,我们过。美国的电视主持人真喜欢吗?一个面部表情极端僵硬的嚣张傻逼在做极搞笑和淫荡的动作,真有那么好么?不重要,重要的是它流行,你不一起玩,不随着一起冲浪,你就浪费了随浪一起上升的宝贵机会。有这些逐浪儿当前,问好不好,没有意义,别人是跟风而已。

左小祖咒从2008年之后节节上升,红得不能再红,各机构不发奖给他都会觉得自惭形秽。和时候问他好在哪里,也许真的稍微晚了一点。从审美上来说,你现在更可能接受的是一个流行文化象征物的左小祖咒,这总是会有一些理解上偏差。所以,当有下一个你无法忍受的歌手出现的时候,请耐心一点,宽容一点,翻一翻他/她的个人发展历史,看看这人究竟是突然发疯的,还是一贯那么疯。如果是一贯那么疯,我觉得,好玩的事情就要开始了。

我最喜欢左小祖咒的一句歌词反而是来自他极为传统的那首《野合万事兴》:姐做狮子先睡倒,郎做绣球滚身上。

[…]

全天候的食物供应,飞饿了就来吃点汉堡吧

我们时常看到有人拿面包屑喂小鸟。要是到了晚上,行人们都回家了,小鸟饿了怎么办呢。设计师 Brian Wolter 为小鸟们打造了全天候的食物供应区——Fly thou。汉堡王(Burger king)提供客人吃剩下的汉堡做鸟食,放在由再生木材建造和 3D 效果喷绘的小屋里,都市小鸟也加入到快餐一族的行列中来了。夜晚降临也不用害怕黑暗,太阳能电池能让这小屋子在黑暗中显得格外明亮。当然,汉堡王也借机做了广告。

在繁华都市,希望小鸟们能很快能适应为她们量身打造的小屋吧。

瞎扯三个热点: UV / 移动 / 数据

瞎扯三个热点: UV / 移动 / 数据

品觉每天都看大量的数据,以及坚持早上阅读各种关于电商额报道,今天来跟大家瞎扯几个观点。

未必精准,只是一己之见。

UV增速放缓

和前两年相比,今年电商热度急剧下降。基本每家都说生意不好做了,甚至一些过去很风光的电商都传出资金链断流等着被收购。

这其中的原因很多,各种分析都有人写过。而我从数据的角度看到了一个有意思的现象,今年电子商务的UV增长跟业务增长是不匹配的。虽然电商整体销售量增长还是很可观的,但是UV的增速货真价实地放缓了。

  所以,我感觉今后UV将不是电商平台的主要驱动力,以后电商平台获取新的UV会更加不容易。比如从京东商城的数据来看,他们的UV增速不如交易量增速,京东也是依赖现有UV提升交易量。

 

  UV增速放缓意味着:平均每个用户贡献的交易量增多了,或者电商的交易转化率在提高。从另一方面来看,UV放缓可能导致未来电商的销量增速放缓,因为过去一年电商的销量一定程度是打价格战打出来的,等于说是赔本做交易的。如果以后不赔本做生意,很难说UV的贡献量还有保证。”

  此外,UV增速放缓将加剧大电商之间的竞争。“天猫、京东、当当、苏宁易购等B2C平台在一定数量的买家中争取‘自己的用户’,甚至需要在每一个买家的网购钱包中争夺自己的份额。电商们已经进入‘买家份额’、‘钱包份额’的时代了。”

明年移动电商会爆发

PC电商热度下降了,而移动电商却在不断升温。

除了京东凡客对外披露过移动电商占比之外,上半年还未布局移动端的B2C平台也纷纷已经动手做无线业务了。今年,移动电商到底发展到什么程度了?我感觉今年年底移动电商已经接近临界点了。电商平台明年交易量如果没有10%来自移动的话,都不好意思跟别人讲自己做电商了。

  我凭什么说明年移动电商会爆发?从我们看到的数据来说,明年肯定会有某些大电商25% 的交易量来自移动,实际上今年eBay在英国和澳大利亚的移动交易占比已经到25%了。如果电商有四分之一的交易量来自于移动端,还不能说明移动是未来电商的核心么?

  数据时代还很遥远

  最后说说我的老本行,电商数据分析。前几天,有个朋友说我,2012年对电商数据分析没有之前谈得多了。这其中有两个原因:一是今年电商都在忙裁员,对数据分析的重视程度下降了;二是我自己对中国电商运用数据的前景没有过去那么乐观了。

  在2010年的时候,无知者无畏,我认为数据能够帮中国电商一大把。经过两年在阿里的历练,以及与各家电商平台的深度交流,发现中国电商距离真正运用数据还很遥远。

  造成如此局面主要有两个原因。

  一是公司CEO心太急,他们都希望用了数据之后立马立竿见影,认为把数据这颗灵丹妙药吃下就会推动销售量增加。对不起,这样你们会失望的。你要让一个数据分析师影响到产品部,再影响到决策层,最后成为公司原材料,这需要一个过程。所以,数据运营是需要耐心的,甚至需要几年时间。

  二是数据分析师团队还需要一段时间成长。就在五天之内,有两家比较大的互联网公司高管问我,哪里可以挖到不错的数据分析师。我给的答案是只能自己培养,就算百度和腾讯这样的大公司,也在大力建立数据分析团队中,你到哪里去挖?而且就算是有个别的数据分析师厉害,在你公司里单打独斗也发挥不出来作用,最后很有可能会离开。

  以我自身的经历来说,我从敦煌网到支付宝用了二年的时间融合了更多人的智慧把支付宝数据分析团队建出来,现在我发现水其实很深,瞄准的地方也和之前有所不一样。

  所以,我认为中国电商距离数据分析还有很长一段路要走,前阵子很流行谈大数据,但我感觉最后会成为一种口号。真正从大数据中获得最大好处的一定是大公司,那些把大数据当做营销来演讲的人不会做出实质性内容的。

  浮躁和急功近利的心态,导致很多公司的产品经理不是产品经理,我真不希望请来很多数据分析师进来,后来这些分析师根本不是数据分析师,结果又把数据驱动这个事情搞得很浮躁。

源地址:http://blog.sina.com.cn/s/blog_5025e38801019caz.html

菲茨定律与互联网设计 Fitts’Law

  这篇关于菲茨定律及其具体应用的文章最早在usabilityfriction.com 上由 Ashley Towers发表感觉写的挺生动, 所以特别编译成中文希望更多的人看到。

    菲茨定律与互联网设计 (Fitts’ Law)

 

  菲茨定律是用来预测从任意一点到目标中心位置所需时间的数学模型。 它由保罗.菲茨在1954年首先提出。这个模型考虑了用户定位点的初始位置与目标的相对距离以及目标的大小。菲茨定律虽然在很多领域都得到了应用但其在人机交互(HCI)和设计领域的影响却最为广泛和深远。(用于估算用户移动光标点击链接或控件按钮所需的时间)目的地明确的移动可以细分为两个部分:首先一个大幅度的移动将光标移向与目标大致相同的方向和区域;紧接着是一系列精细的小幅度微调来将光标精确定位在目标中心。你现在就可以做一个小实验来观察这一过程 –举起你的手臂并试着用手指指向远处的一个小物体,例如远处墙上的一个电灯开关。开始你的手臂可能会往开关的位置大幅的移动而且很有可能稍微过头了一点。接下来你会做一些微小的调整动作直至你的手指正好对准目标开关的中心。现在你可以试着指向一个更大的物体 – 比如说电视或一面墙壁。这一次你也会以大幅度的手臂动作来使手指指向目标方向, 但因为目标体积很大所以一般情况下你只需要做很少(甚至不需要任何)的微调。

 

  让我们来看下面这个例子。图中的红色盒子代表目标;虚线代表从起点至目标的移动轨迹,目标上灰色左右箭头之间的范围是用户光标减速并微调以弥补误差的区域。在右方有一个较大的目标,因为面积很大所以用户从任意点快速点击应该不会很难:

 

  大的目标区域意味着光标在目标上停下来之前不需要做太精细的调整在下一个例子中,屏幕的右方有一个小得多的目标所以用户快速点击目标会困难得多。

 

  因为用户需要将光标移动较长距离而且目标面积很小所以在光标正确的对准目标前需要做一系列精细的调整动作。但如果同样大小的目标距离很近的话,因为到达目标范围所需的初始动作很小所以准确点击它的难度也会小很多。距离越近, 初始动作因为幅度太大而超出目标区域的风险就越小。

 

  对于形状不规则的目标而言,目标区域的大小和移动的方向是相对的。在下面的例子中,如果用户从和目标平行的位置水平移动光标,那么这个按钮的相对目标区域就很大。但如果用户光标的初始位置在目标的上方或下方,那么这个长方形按钮的相对目标区域则小得多。

 

  除了调整目标的大小以外,我们还可以将目标放在屏幕的边缘或角落上来使其更容易被选中。因为在屏幕边缘和角落位置时它们是“无限可选中”的;具体一点来说就是 – 有一个隐形的边界来阻止用户的初始大幅移动让光标超出目标区域范围,这样的话普通指向性移动的第二步“微调”动作就不需要了。

   这个方法在两大主流OS中都起到了很好的效果:Mac OS X默认将底栏(Dock)放到了屏幕的最下方;这样的话底栏就变得“无限可选中”,因为用户不能将光标移到底栏下方所以在向底栏方向做出大幅度移动后光标始终是落在底栏上的。

 

  在Windows中,开始菜单在屏幕的左下角,这个角落是“无限可选中”的,因为不管用户朝左下角方向做多大幅度的摆动,光标总是会停在开始菜单按钮的上方。

  Mac OS X系统和Windows系统的一个最大不同之处便是程序菜单的位置。 Mac OS X将菜单置于屏幕的顶端而Windows将它们放置在单独的应用程序窗口上。 菲茨定律显示在许多情况下Mac的做法是更好的:在Mac OS X中用户不论如何将光标抛向屏幕顶端其总是会停在菜单上。 而在Windows中的窗口模式下应用程序菜单则没有像Mac中的“无限可选中”的属性。

   但是, Mac的做法也开始凸显出其局域性。虽然Mac OS X下的程序菜单是“无限可选中”的,不要忘了菲茨定律也考虑到了用户当前定位点与目标的相对距离。随着显示器尺寸越来越大,双/多屏显示器的配置越来越常见。Mac的用户不得不在这些情况下穿过很长的距离来让光标到达主屏幕的顶端菜单。这样的话长距离拖动光标所耗费的时间可能会超出不用做细微调整来矫正光标位置而省下的时间。

菲茨定律的应用

   网页设计师最大的遗憾之一就是不能利用浏览器的边角和边缘作为可“无限可选中”的区域。不过设计师仍然可以按照菲茨定律在设计上做一些优化。

  •放大链接点击区域。在链接文字周围放置可点击的填充区域,这样用户想要点击的链接文本会有更大的容错性。

  •当您有几个放置在一起的可点击目标或链接时,把它们的体积增大或增加他们之间空白区域的大小。搜索结果中的网页导航链接通常都有很差的可用性。例如,下图中的搜索结果页面就显示了太多的结果,并且这些结果互相之间也离得太近:   亚马逊(Amazon)在处理搜索结果的方法上则要高明许多     •将用户最有可能点击(或最想要)的按钮放大。例如,将”OK”按钮设计的更大:   •将动作分类 – 如果相关的操作按钮靠近彼此的话,则不仅可以在视觉上增强用户对它们相关性的认知,还可以减少光标在它们之间移动所需的距离和时间。     最后请记住,一定要敢于尝试!37 Signal在它们的产品Sortfolio主页的“Signup”按钮上就有一个灵活运用菲茨定律的有趣实验 – 当用户的光标划过时按钮会自动变大并显示更多信息 – 这样的话当用户即将开始做细微调整以精确定位光标至按钮时,微调的必要性因为按钮的自动增大而大大减少了!多么绝妙的创意和应用啊!   […]

Category

Archives