星期二, 四月 03, 2007

socialization search engine and intelligentize searching 以及网兜wangdou的想法

今天和优策公司的人谈论了一下企业搜索的相关内容,他们需要了解的是在企业内部对于搜索的需求是什么,什么样的搜索可以更好对企业有所帮助,一个半小时的时间,他们有所收获我也如此。
对于企业搜索(enterprise searching)而言,当然还包括专业搜索(specialist searching)、垂直搜索等等,以及最基本的网页搜索GOOGLE、YAHOO、BAIDU等都属于此列。但是不管使用什么样的方式,最终的目的是一样的,那就是使用各种搜索的最终目的是为了满足使用群体的“需要”!我们的“需要”是什么?在浩如烟海的信息中寻找到我们要找到的东西,仅此而已,这就是我们的最终需要。当然,目前使用搜索引擎的人还有这样的一些人,他们只是通过各种稀奇古怪的关键字(key words)来做检索,然后就天马行空顺着检索到的网页开始漫游,真正意义上的冲浪了,当然前提是检索出来的东西必须有可以吸引人的地方,要不看到同样稀奇古怪的页面检索内容也是一件头疼的事情。

这个里面最重要的就是搜索引擎能给我们提供什么?提供的东西是不是我们需要的?我们是不是要加更多的关键字来建立更加严谨的过滤检索规则?

此处剪去一部分内容,因为曾经导致本页面无法打开,具体原因因为涉及到GooXXX,所以只好妥协删去!


如何从大量的信息资料中抽取我们想要的东西,很难,确实很难。对于网页搜索引擎而言,最基本的搜索单位是网页,可视的网页,这些从开始可能确实对我们很有帮助,从只记住几个门户网址开始到现在只需要输入几个关心的关键字就可以列出全球的相关网址,已经给我们最终用户有了一个很好的用户体验。但随着网页信息丰富的极大化,这些东西已经不能完全满足我们的需要了。后来出现的,百度的MP3搜索,代码搜索,行业搜索,图片搜索,房地产搜索,甚至包括机票搜索等等出现在了人们的视野里面,相对于网页搜索,这些搜索的空间更大,给用户的体验更加的深刻,与普通网页搜索的最小单位网页不同,这些垂直搜索是以结构化数据为最小单位,更加符合用户的专门搜索需求。除了单独的用户群体需求之外,一些企业也开始有了对搜索引擎更加深入的要求。这样就出现了专门的企业搜索引擎,这些搜索是专门为企业的需求定制的,是对企业的海量数据进行再挖掘再分类的结果,能充分的满足企业搜索的目的。
但是未来的搜索引擎就仅此而已么?当然不是,就算以目前这些专门的垂直搜索来看,也不能完全的满足用户的需求。比如,我输入的关键字是A B C,我需要的找到的内容是D,但是和A B C关联的可能有E F G D,这时不管是网页搜索还是垂直搜索,其搜索结果的顺序可能是F E G D,我们需要的内容可能排在最后,甚至没有,这里就有一个搜索效率的问题。我们关心的内容如何才能出现在搜索结果的最前面?智能化搜索就可以完全的解决这个问题,虽然目前智能化搜索还只是一个理想,毕竟计算机不能代替人类来分辨A B C和D之间的超过逻辑的关联关系,更何况可能D结果对甲有用,E结果对乙有用,这些已经完全的超越了计算机算法的范畴,因为里面的搜索结果因素已经牵扯到了人。
社会化搜索引擎+垂直化搜索引擎=智能化搜索,这是现在一个很简单的解决智能化搜索难题的方法。社会化搜索就是在搜索的过程中让人也参与进来,让用户参与进来完善搜索的结果,通过人的参与,大量用户群体对搜索结果的参与可能会在很大程度上完善搜索的结果,打个比方,如果大量的计算机专业用户群体参与,那么搜索结果可能就会很大程度上将计算机专业相关内容提前,降低相对无用的信息做为结果提交,如果换做其他大量行业用户,那么相对而言计算机专业的信息就相对的变成了无用信息。这样的搜索引擎就会提高搜索工作的效率。外国有一个CHACHA网络(取于中文拼音“查”)WEB2.0的搜索引擎,也是除了在后台的专业垂直搜索引擎之外,还引入了人的参与。但是不可避免的是,同样的“人”也可能会提交不同的完全没有意义甚至是恶搞的信息,这样的参与者如果基数很大,那么搜索结果可能就会变得很可笑。后来chacha网没有办法禁止这样的广告、恶搞和无意义的信息提交,人的参与变成了一个空话,最后不了了之。那么如何限制人的参与是往好的积极的方面去呢?这个办法我们后面再说。除了人的参与之外,我们是否还要建立用户注册制度,比如说,甲用户登录,那么甲用户的历次搜索关键字会被后台的计算机通过算法学习,结合垂直搜索中用户参与的信息分类以及其他相关类似用户关键字的学习来界定甲用户的搜索结果排序。这样甲用户搜索的结果排序就会根据甲用户历次使用搜索变得更加准确,更加符合甲用户的信息关注度。这样在目前智能计算机尚未出现之前,智能化搜索可以近似的在这种基础上面实现。当然所有的这些都是建立在我们相信网络上面大多数人的行为都是积极的有帮助的,个别恶意的行为会在大多数善意的行为前被湮灭。为了更好的杜绝恶意的人为参与,我们就要建立更加完善的机制来鼓励和提高可利用价值信息。

在这些想法的考虑前提下,网兜诞生了,这是我的一个想法,网兜就是一个能自我成长的社会化搜索引擎,虽然现在说搜索引擎实在是太早了一点,但是我确实是想让她往这方面来发展,网兜就是建立在有人参与的基础之上,我们确信来网兜的人都是积极的,提供的信息都是有帮助的。网兜目前的全部的工作有点像一个大的多用户的信息内容提交平台,所有的人提供他们认为有帮助的信息,不管是什么东西只要用户认为对他自己有帮助,那么我们就可以认为对其他类似的用户也一样有帮助,甚至是一个想法一个梦都可以做为充实网兜的信息。在我看来最后的理想的网兜是一个用户基数大,信息内容极大丰富的信息平台,这个里面包括了用户参与提交的信息还包括了我们网兜自己搜索到的相关垂直搜索结果,每个用户提交的信息可以包含很多个TAG,我们用TAG来做为我们的分类,这些TAG之间可能在别人看来毫无关系,但是只要提交用户觉得有用就可以随意增加,网兜本身的垂直搜索引擎也会有目的的包含几个大的TAG分类,这样在通过用户评分系统(对,就像dig一样)来让无用的广告的信息湮灭,排除在有用的搜索结果之外,最后在这个基础之上,搜索的结果就会随着用户参与度的提高和信息的不断扩展而不同。虽然这个索索的结果和我在上面所说的智能化搜索有点不同,但是她带给人们的搜索结果确实时刻保持的新鲜感,你可以在上面找到很多专门的对你有用的信息,只要你选择计算机、LINUX等分类,你也可以在上面随便输入几个关键字来查看更加奇怪的搜索结果排序,就像我说的那样,你搜索计算机可能由于用户参与度的不同,出现的是狮子头的做法,这样也适合于那些喜欢真正通过搜索引擎来无目的冲浪的人们。唯一影响搜索结果不同的就是用户的参与度,所以我可以说网兜是在用户参与关注下自我成长的社会化搜索。目前的网兜还差的很远,用户的参与度也很低,当然和还在测试期没有正式推出有关。可能这就是我对社会化搜索以及专业搜索的一点看法以及尝试,我希望能通过网兜的不断完善来找到一条逼近智能化兴趣化搜索的道路。

对网兜感兴趣的,可以过来看看,欢迎光临网兜,提出意见

试试看网兜目前搜索>>>>
网兜目前的TAG分类

Ads Apple Audio Blog blogspot BMW Boeing cafe CD Clark comic Cool CRM DesktopComputer deviantART DKNY download Equivalent Evidence Freesoftware Geeker GNU Google GPS GSeeker heal herr bar iPod Iraq JohnLocked jpg kodak Linutop linux Milenio mini mp3 MV Nokia paintdraw PARFUM photos photoshop Project remote car Resolution RobertCastillo slide Tips Top100 Tricks UFO usb Vision War websites x file xfile yahoo YouCai 世界 主题 交通标志 人体 你所不知道的 信息 做梦 健身 免费 内蒙古 冒险 写字 凉皮子 分享 分类 创意生活 办公室 动感单车 北京 博客 台球 吃喝 后院男孩 咖啡 图片 壁纸 外国小说 外套 外星人 太有才了 奇迹 宝马 对白 寻宝 小资 巨蟹座 幻灯 广告 广告创意 座位 徒步 微软 快速通过 想法 手机 手表 护肤品 拖鞋 招商 搜索引擎 搞笑 携带 文库 新闻 旅游 时间 普洱 暗算 有意思 未分类 未来 李克农 比赛 水滴 江湖 汽车 波音 溜冰 漫画 烤包子 特科 狗鼻子 狮子头 生平介绍 电影 碎片 神乎科技 经典 网兜广告招商 美剧 美味 美国广播公司 耳机 自动生成 自由 自由软件 自驾游 艺术 蘑菇宴 视频 计算机 论坛 访问 识香 诺基亚 谷歌 超超 路书 遥控汽车 酒吧 钱之江 钱壮飞 铁观音 阿尔山 雅虎 飞行器 香水 马赛克 魔幻 龙顺园

没有评论: