设为首页
加入收藏
帮助中心
首页 | 红盾通告 | 信息中心 | ASP技术 | 数据库 | 网页设计 | 网管专栏 | OICQ攻略 | 墨客频道 | 网站运营 |
当前位置:首页 >> 网站运营 >> 百度排名 >> 正文
最新信息
·突破百度贴吧的验证码限制
·百度的38个我预示互联网2.…
·让百度重新收录的方法
·百度贴吧:创新根藤的价值…
·我从百度来30万IP的经验
·你了解百度蜘蛛吗?
·hao123网址之家网站收录原…
·收购网址站尘埃落定 百度打…
·解读百度的收录和清除站点…
·怎样提高网站在百度被搜索…
资料搜索
热点信息
·为什么GG对竞争广告如此在…
·百度点击价格不完全分
·百度主题推广服务新手入门…
·百度取消了搜索联盟5000IP…
·收购网址站尘埃落定 百度打…
·百度何时出统计数据及何是…
·突破百度贴吧的验证码限制
·百度的38个我预示互联网2.…
·hao123网址之家网站收录原…
·百度对作弊行为的说明
推荐信息
·我从百度来30万IP的经验
·如何使网站被使百度有效收…
·百度竞价排名关键字管理技…
·百度对作弊行为的一些惩罚…
·百度Google文档搜索应用与…
·百度的搜索排名原则
·百度主题推广服务新手入门…


Google
 
百度Google文档搜索应用与比较
〖编辑:Cloudy | 浏览:人次〗

互联网上除一般网页外,还如 PDF,DOC,RTF,xls,PPT(S) 等的文档文件 , 虽然这些文件不象 HTM 文件那样多,但这些文件通常会包含一些别处没有的重要资料 , 因此具有独特的价值和吸引力 ! 所以对网络中这部分资源的挖掘和利用也是搜索引擎的一个重要功能 . 对网络的这部分资源的挖掘和分析的水平也成了衡量一个搜索引擎完整与否 , 成熟与否的重要指标 . 多文档搜索是高级搜索的重要内容 , 与其他高级搜索功能一起 , 构成高级搜索功能体系 .
我们就一些搜索案例的比较来给大家展示一些网络文档搜索的技巧 , 并对主要提供文档搜索的搜索引擎百度和 google 做一比较 , 这些比较和方法也许会对你进一步准确获得你想要的信息有帮助 !

主要比较文档数量 , 语法使用的灵活性 , 准确性 , 多语法混合使用等等

数据
Query
参比引擎

百度
Google

filetype:doc 搜索引擎
1050
743

filetype:doc 计算语言学
546
214

filetype:doc 计算机检索
17700
6080

filetype:ppt课件
13900
1480

filetype:ppt 软件开发模型

filetype:ppt 软件 模型

560
697

919000
697

filetype:pdf xml高级编程
55
116但是匹配的质量很差,由各自不同的分次特点决定的。

filetype:pdf 服务器安全
17800
6240

filetype:xls 报名
9940
1890

filetype:xls 名单
32300
3000


表1 文档数量比较

性能
功能
参比引擎

百度
Google

灵活性
支持三种方式查询
1 filetype:格式 关键词
2 关键词filetype:格式
3 在高级搜索里选择
支持三种方式查询
1 filetype:格式 关键词
2关键词 filetype:格式
3 在高级搜索里选择

准确性 整体上讲根网页搜索的效果差不多 ,由于各自分词的特点不同,所以对中文语义的理解上就会出现差异,所以在结果的数量并不是全部,但是对大多数关键词来说,百度的结果还是比较符合搜索目标的,而个别google的搜索结果就不太能令人满意。这也是由于google的强行前台分词造成的,结果数量多,并不精准。对于文档搜索来说准确恰当才是最重要的,数量只是其次。

多语法混用
一般的逻辑搜索:+ - | 均能很好的支持
filetype:doc 演讲稿 吴敬琏
filetype:doc 演讲稿 - 教师
filetype:doc 演讲稿 | 演讲

其他高级搜索指令:
吴敬琏 filetype:doc site:pku.edu.cn
历史 filetype:doc inurl:org
经济 filetype:doc inurl:title 目前网络上很少有中文文件夹所以这样的检索也是没有意义的。

其他支持
1 支持对所有文档类型的搜索,filetype:all
2 支持把原来文档转换成html格式文档浏览
3 不支持对更多文档类型的扩展,但是可以在mp3搜索中选择flash类型搜索,但是百度支持在网页搜索中输入“mp3:刘德华”“flash:小兵”来搜索歌曲
1 不支持对所有文档类型的搜索,
2 支持把原来文档转换成html格式文档浏览
3支持对更多文档类型的扩展,如swf/xml 目前google还不支持更多

表2其他参数比较

一搜也提供文档搜索,目前支持的文件类型不多,文档的数量也不够(或者可检出的数量不够),而且使用习惯与其他的不同(google,altavista,alltheweb等)所以不列入比较范围。
总体评价,百度多文档搜索无论从搜索的质量和数量都是要与google相当,甚至超出google,说明,中文搜索引擎在应用的深层次挖掘上已经不再落后于外来服务商。
我们有理由相信百度会提供更多更好的功能!


录入时间:2007-07-07 09:17:45 [打印本页] [关闭窗口] [返回顶部]
特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。

Copyright © 2006-2014 0733168.Com Inc All Rights Reserved
关于我们 | 广告合作 | 联系我们 | 法律声明 | 友情链接 | 意见反馈
本站所收录信息、社区话题、及本站所做之广告均属其个人行为,与本站立场无关
湘ICP备06008436号