利用Google Search Appliance 服务器做SEO

昨天,Stephen留在中国的Google Search Appliance 服务器到了。这次Google Search Appliance(简称 GSA)和去年用的那个google mini不一样,这个GSA基本上可以看做是google mini的升级版本吧。

Google推出GSA的目的是让那些信息量暴增的企业和机构能用它建立自己的搜索引擎。它支持的格式有220多种,你可以用它来抓取和收录自己的博客、网站、数据库和网络文件夹等等。它是机器和软件全部打包在一起的。

Google官方网站介绍:http://www.google.com/enterprise/search/gsa.html  

Google Search Appliance 正面

  主要特点有以下这些,随意看看就好:   – 有一个连接器管理工具,可以让你收录和那些非WEB格式的文档。如:word,pdf,flash 等等 – 如果使用 Feed API 和元数据搜索功能,可以为自己的论坛建立搜索功能。 – 还提供了强大的 Onebox 编程接口,可以让你在搜索结果中展现一些定制的信息。 – 强大的安全搜索功能支持多种身份认证方式,使用户在搜索结果中只见到自己有权限访问的文档。 – 为小规模文档设计了专门的网页排序算法。 – 用户可以定制搜索结果界面,甚至以 XML 格式的形式,来整合到您自己的应用中去。   这个对SEO也是非常有用的。为什么这么说呢?   你可以把这个GSA看做是google 的微缩版,它有爬虫,有索引库,有排序算法。它的的硬件和软件都是现在google.com这个网站正在用的东西。所以两者之间相似程度非常的高。我在过去操作google mini的时候已经证实:至少它的抓取机制和现在的google.com几乎是一摸一样的。   它的排序算法,我觉得也会有很大的相似度。当然不会一摸一样的,因为现有的GSA好像是依据06年的搜索技术改变而来,而以google每年450次的算法调整频率,到现在也相差比较多了。但是至少和现在的排序算法会有相当大的相似度。   还有一些有意思的东西,大家看上面提到的两个特点:“Onebox 编程接口”和“在搜索结果中只见到自己有权限访问的文档”。这其实就是现在google的一些应用。   Onebox在搜索引擎现有的排序算法中享有优先级,它的数据来源就是Google Base或其他google产品。这次GSA也提供了这种Onebox的编程接口,现在自己亲手给自己的GSA添加Onebox,一定会对你如何利用Onebox拿到更多流量有帮助的。   […]

封掉Google——programmers(3)

这个系列的漫画讲述程序员——这种神秘人类的囧事,故事多来源于我身边的程序员朋友,且以互联网开发背景为主。

如果你有什么可乐的关于程序员的故事、对话、代码,愿意通过漫画的形式分享,请给我发邮件。arthur369@gmail.com。

让日本人抢下SEO的关键字,是谁的失败?

今天发现,baidu.com有国际接轨的倾向,搜索seo的关键字,已经可以查询到日本的网站。

如果这不是baidu的技术失误(应该是和baidu.jp的数据混了,用户搜出来这些结果没有意义) 那国内的从业者,将面临来自各国SEOer的挑战。

如果真有那么一天,为了知己知彼,我们先来分析一下对方站点的情况:

noydir,noodp的应用:

comsort.jp在源代码中用到了<meta name=”robots” content=”noydir,noodp” />来调整搜索结果的标题和描述。说明该网站加入过一些分类目录,有可能以前的网站业务与现在的不同。(该标签告诉google和yahoo,不要按照默认情况,抓取分类目录里面的信息做title和description)。 如果我们将来要使用老域名做新网站,不妨吸取一下他们的经验。

高质量的外部链接:

大家看上图的查询结果,或许会认为该站点外部链接太少,不配站在那么好的位置上。 这里说明一下,外部链接并不是越多越好。像该站点的外链,基本上都是从相同主题的高PR站点上获得的,大部分保证了链接格式的一致性,关键字就是SEO,摆明了要抢这个词。 而国内很多站长,目前都是通过“交换链接”来取得外链,这类的链接价值会越来越低。

SEO内部优化:

该站点的前端工程师,对标签的运用非常到位,从h1到h3往下逐级进行分配,在图片和链接上也均给明了alt及title属性。同时,巧妙的避开关键词的叠加。在其他方面,均按照搜索引擎的推荐:不超过70字节的主标题、不超过155字符的描述。

字体的性服务

Image: Wallpaper.com

伦敦街头著名的红色电话亭是著名的文化标志,然而走进外表光鲜的电话亭却是阵阵浓重的骚味——无数无家可归者将这些电话亭当作最好的避难所。此外每个电话亭里面也注定贴满了众多性工作者的广告卡(Tart Card,下图),这也是伦敦街头的另一地下风景和文化标志。这些设计甚至影响了一些主流设计师,包括来自皇家艺术学院的 Tom Phillips 和性手枪(Sex Pistol)乐队设计师 Ray 和 Nils Stevenson.

Image: stefZ@Flickr

《Wallpaper》杂志在出版自己第一期“性爱”特辑之际,联合 Type LLP 和 St Bride Library,邀请从著名工作室设计师(包括 Build、Why Not Associates 和 Spin 等等)到设计学生的一大批人,请他们根据自己选择的字体设计字体的性爱广告卡。重新设计的卡片也会随后在伦敦的 KK Outlet 展出。

[…]

《纽约客》:慢设计与实用主义(下)

前文提到对于 Michael Bierut 对《纽约客》恒久不变的“慢设计”态度的赞誉,很多设计师也对于它即便缓慢的变革而痛心疾首。然而,对于固守传统持否定态度,主张设计上激进变革的人也大有人在。在2007年的一篇 AIGA 的文章中,与 Bierut 同在 Pentagram 工作过的 KT Meaney 强烈地批评了《纽约客》逐渐老化的设计。他表示,仅仅重复从前的排版并不能证明它的优越性,其在功能性上已经无法满足当代读者的需求。他笑称《纽约客》没有专门的设计部,因此会出现连续两行末尾使用连字符(hyphen)、Caslon 斜体和 Irvin 体混用、行首单字(Orphan)的种种细节错误。因此他提出了一系列更新方案。有趣的是,如此“革命性”的重设计提案仍然最大的保持了《纽约客》原有的风格,只是从实用主义出发修改了细节的排版和字体,并没有出现近年来流行的天翻地覆式的推到型重设计。

作者/ Author: KT Meaney © 2007 AIGA 原载于/ Original from: AIGA, 2007 图像/ Images: AIGA, 2007 翻译(有删改)/ Translation (with modifications): Rex Chen 1. 杂志头

首先要批评了杂志头的设计。1980年代电脑重绘的经典 Irvin 体的杂志头与早期的手绘设计比较(如图),过于棱角分明,过于冷酷,失掉了原有的味道。但新的重绘还是改进了一些字距的问题,比如“T”和“H”,以及“Y”和“O”。(译者注:另外价格和日期的字体也出现了不同,原来设计中的字体只在整本杂志中出现了这一次,因此也为很多设计师做诟病。杂志社2000年将这两行的字体也使用 Irvin 体,虽然解决了字体纷杂的问题,但被批评降低了杂志头的突出性。)

2. 目录页 忽视了内容的目录页

从1925年到1969年,《纽约客》一直没有目录页,而且今天仍有很多人说它的目录页仍然没有实质的作用。这一期目录页在第六页,夹在两个广告之间,一页的空间实在不够(右图)。杂志在目录页的设计上希望给足够的注意力给作者,因此作者占用了最大的空间和设计注意。这之外,实质的文章内容却很难掌握。目录页继承了有限的字体、字距和行距构成的视觉传统的不足。因此杂志设计部门决定是“创造拥挤”。由于版面限制,放下全部内容根本无法实现,因此活动(Goings on About Town)和城市短文(The Talk of […]

图形界面——programmers(2)

图形界面——《神秘的程序员们》系列漫画

这个系列的漫画讲述程序员——这种神秘人类的囧事,故事多来源于我身边的程序员朋友,且以互联网开发背景为主。

如果你有什么可乐的关于程序员的故事、对话、代码,愿意通过漫画的形式分享,请给我发邮件。arthur369@gmail.com。

事物的本质——programmers(1)

事物的本质——《神秘的程序员们》系列漫画

在霍炬的鼓励下,我决定创作关于程序员的漫画。我已经不动笔好几年,当然动笔之前水平也够烂~~

这个系列的漫画讲述程序员——这种神秘人类的囧事,故事多来源于我身边的程序员朋友,且以互联网开发背景为主。

如果你有什么可乐的关于程序员的故事、对话、代码,愿意通过漫画的形式分享,请给我发邮件。arthur369@gmail.com。

对Unix40岁的一些感想

1.

上个星期,ComputerWorld发表了一组文章,庆祝Unix操作系统诞生40周年。

虽然我以前就知道Unix的故事,但是这组文章还是令我读得津津有味。

我第一次发现,Unix这个改变了计算机工业和人类社会的操作系统,完全是一个意料之外的产物。

一个赋闲的程序员+一段意外的假期+一台被淘汰的设备,Unix就这样诞生了。

2.

那个赋闲的程序员,叫做Ken Thompson。照片上看上去很成熟,其实年龄不大,发明Unix的时候只有26岁。

1969年,他参与的研究项目Multics被贝尔实验室取消了,他顿时就无事可干了。

正好那年夏天,他的老婆带着孩子回娘家了,只留下他一个人在新泽西。反正空闲时间多得很,他就用了一个月的时间,在家里写了一个小型版的Multics。

但是,贝尔实验室没有机器可以让他测试,因为那时计算机太贵了,不可能用于一个年轻程序员的业余项目。Ken Thompson没有办法,只好在一台型号为PDP-7的小型机上测试自己的软件。这台小型机因为性能太差,所以没人去用,就被闲置在一边了。

虽然PDP-7叫小型机,其实也是庞然大物,需要一间房间才能放得下。

PDP-7在1965年上市的时候,价格是72000美元,已经属于超级便宜的计算机了。第一版的Unix就是在这种机器上诞生的,下面就是一张Ken Thompson和他的同事当时的工作照。

3.

Unix的发明其实只是40年前的事情,但是已经古老得像传说一样了。

说起来真是让人吓一跳,40年前程序员日常工作的一部分,就是在纸带上打孔,因为大型机只认识纸带输入。我们今天熟悉的显示屏,还必须等到70年代才会出现。

但是,从PDP-7到今天的网络时代,只花了40年。

技术进步的速度快得可怕。

4.

40年前,电脑没有显示屏。

30年前,大多数电脑还不能放在写字桌上,因为太大了。

20年前,世界上还没有一张网页。

10年前,搜索引擎还不存在,原因是网站太少,没有搜索的必要。

那么,此时此刻正在发生什么呢?……

5.

Unix的发展史,进一步确立了我的一个想法,那就是社会进步的根本动力是技术。

君不见因为科学技术停滞不前,中国的封建社会可以长达2000年。而欧洲为什么会发生文艺复兴?一个重要原因就是印刷技术的传入,使得新思想有机会广泛传播。

Unix是互联网背后的关键技术,只用了短短40年就把世界完全改变。

所以,我的想法是,如果我们这一代人想要推动社会进步,在阻力很大的情况下,不一定要走政治这条路,而可以改从技术入手,用新技术来推动社会改造。

(完)

《纽约客》:慢设计与实用主义(上)

伦敦的街头报摊随处可以看到《纽约客》(New Yorker)杂志。这本将近四分之一是在讲述纽约文化新闻的杂志原本注定了它的本地性,但这却远远无法阻挡它的魅力风靡全球——近100万订阅量中仅有16万来自纽约。大都市精英知识分子的定位为其带来了大量优秀的记着和作家(著名的如E. B. 怀特、伍迪·艾伦和苏珊·桑塔格),大量的长文报道向美国的中上层知识分子讲述着他们应该关注的社会话题。这本1925年创办的杂志尽管已经度过了80多年,但今天已然充满锋芒具有活力。《纽约客》现在“早已成为美国人社会文化传统的一部分,成为纽约乃至美国知识分子的一个象征。”

1925年2月21日第一期和2009年6月1日上周期。

然而包裹着这些批判和激情的,却是冷静平淡的设计。比较1925年的第一期《纽约客》的封面和上周艺术家 Jorge Colombo 用 iPhone 制作的封面,两者除了插画风格以外惊人的相似。一样的左边彩条,一样的标题字体,一样的价格和日期注释(左右调换了一下)。事实上翻开杂志会发现,《纽约客》在80年的发展中,设计竟然没有大的变化。今天的版式、字体、广告安排、甚至漫画的风格都仍然保持了与80年前第一版最大的相似度。承认除了封面,“几乎只能靠广告来识别某一期的大概年代”。

典型的《纽约客》一个跨页设计。Image: newyorker.com

《纽约客》第一期的页面设计,也就是84年来一贯的设计模式,是第一任艺术指导 Rea Irvin 设计的。这位前任《生活》(Life)杂志的艺术指导,很快就被《纽约客》创办人 Harold Ross 相中,出任新杂志的艺术指导。他确定了杂志的三栏网格的版面,并制作了具有很高识别度的《纽约客》的标题字体,现在仍被称为“Irwin 体” ,或就叫“New Yorker体”。这一字体根据美国铜木刻工 Allen Lewis 手绘的字体设计成,现在已经是杂志的标志,现任艺术指导 Françoise Mouly 将其描述为“代表一个时代的字体”。除了设计,Irvin 也绘制了169副封面和大量的插图漫画,这些作品同时也“定义了”著名的“《纽约客》漫画”的基调。杂志在 Rea Irvin 的讣告中称 Irvin 的作品“质优如中国书法,兼具西方的大胆用色”。

手绘的排版分割线。Image: newyorker.com

杂志第一期封面中 Irvin 绘制的戴着单眼镜、穿着讲究的公子形象,被称为“Eustace Tilly”,后来成为《纽约客》的形象标识。而第一期全副与内容几乎无关的插画,以及左边的彩条,都成为以后80多年来一贯的封面路线。《纽约客》页面设计极为优雅。当时的字体顾问 Elmer Davis 确定了启用 Caslon 作为正文字体。Caslon 和 Irwin 体的搭配经典平和但充满智慧。内页设计基于杂志设计上“horror vacui”的原理,即“对空白的恐惧”,设计中避免留白,仅有诗歌享有较多空间。内页的分割线采用手绘风格,是我最喜欢的细节之一。插图、漫画和诗歌的安排随意而活跃,既没有落入装饰的俗套也没有丧失趣味和持续性,与正文浑然一体。

[…]

计算机是懒人的科学

Contents 序 计算机是懒人的科学 几个小软件 Emacs Firefox LaTex 让开发自动化 原来生活可以更美好 学习资源 序

折腾计算机两年多了,现在才算懂了点门道。从最开始的开机关机,到最初战战兢兢通宵装 xp系统,到Vmware带来的神奇,到luckweb的丰富,到Fedora 8的一丝不惑,再到 Ubuntu的博爱,我终于走进了GNU的大门。自由与开放的广阔世界,GNU,GNU is Not Unix, 我越发感到,这,就是我需要的世界。

本文会教你:

如何配置一个Ubuntu下完整,轻巧,高效的c(c++, Java)开发环境 如何维护和保持代码和文档的一致性 如何配置一个舒服的LaTex+CJK的文档办公环境 如何高效的使用Ubuntu系统 经典学习资源推荐

本文不会教你:

什么叫GNU, Ubuntu, Emacs…… 基本的Bash命令 基本的Emacs,Vim操作 计算机是懒人的科学

计算机是懒人的科学。这点从计算机的发明就可以看的出来。众所周知,ENIAC的诞生是为 了计算,是为了弥补人脑的不足,减轻计算负担。

为了批量的计算,人们发明了机器语言;

为了简化机器语言,人们又发明了汇编语言;

为了进一步简化,人们发明了c,写了Unix;

为了更好的软件重构和代码重用,人们又发明了c++;

人们发现c++简直太tmd的复杂了,于是就发明了Java。

为了更好的维护程序文档,人们发明了docbook。

为了更好的排版质量,Knuth大人冲冠一怒,整整十年,发明了伟大的Tex排版系统。

后来Leslie Lamport说:Knuth你那个Tex系统简直太tmd的难用了,于是他就写了个 LaTex,极大地简化了Tex的使用,使得一个初学者在半天的时间内也能排出具有国际水准的 文档来。

后来中国人发现这LaTex先天不支持中文,于是就有人站出来发明了CCT,德国人还发明了 CJK(Chinese, Japanese, Korean)。

后来人们又发现CJK生成字体太tmd的麻烦了,于是有勇士站出来,写了xetex,直接调用系 统字体,这下好了。世界清静了1。

为了更高效的编辑文本,人们就发明了vim和Emacs。

后来人们又给Emacs增添了很多乱七八糟的功能,于是Emacs成了一中生活。

人们发现文件管理真是件无聊的事情,于是就发明了sh脚本语言。

人们发现程序的Api文档撰写麻烦死了,于是Java有了Javadoc,C++有了Doxygen2

[…]

Category

Archives