|
7) 搜索引擎忽略的字符以及强制搜索
Google 对一些网路上出现频率极高的英文单词,如"i"、"com"、"www"等,以及一些符号如"*"、"."等,作忽略处理。
示例:搜索关于 www 起源的一些历史资料。
搜索:"www的历史 internet"
结果:以下的字词因为使用过于频繁,没有被列入搜索范围:
www 的. 已搜索有关 www 的历史 internet 的中文(简体)网页。 共约有 75,100 项查询结果,这是第
1-10 项 。 搜索用时 0.22 秒。
我们看到,搜索"www 的历史 internet",但搜索引擎把"www"和"的"都省略了。于是上述搜索只搜索了"历史"和"internet"。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索"www
的历史"的时候,搜索引擎实际上把这个短语分成三部分,"www"、"的"和"历史"分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的"www
的历史",但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的"+"号。
搜索:"+www +的历史 internet"
结果:已搜索有关 +www + 的历史 internet
的中文(简体)网页。 共约有 25,000 项查询结果,这是第 1-10 项 。 搜索用时 0.05 秒。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例""world war
I""中,"I"其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:" "www的历史"
internet"
结果:已搜索有关 "www 的历史"
internet 的中文(简体)网页。 共约有 7 项查询结果,这是第 1-6 项 。 搜索用时 0.26
秒。
我们看到,这一搜索事实上把"www 的历史"作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。 |
|
|
|
|