网页搜索
搜索引擎在评估网站内容,并决定其是否和搜索者的查询相关时,需要知道该网页确实存在,并从网站摘录内容,以便日后分析。
1.发掘网页:搜索引擎通常通过其他网站链接或某一网站的内部链接来寻找网页。关于发掘过程需要记住的最重要一点就是你应该建立一个大一些的网站,吸引其他人和其建立连接。而且,你还应该拥有全面的网站导航结果。当然,就算不存在搜索引擎,你的网站也需要这两方面的东西。
2.搜索网页:某个搜索引擎一旦对网页有所了解,比如谷歌,就会让某个“站点”去搜索这些网页。你很可能希望整个网站都被搜索。但是,这很可能会由于搜索效率低或者基础结构(阻止站点登陆网站)等因素而受到阻碍。
3.摘取内容:一旦某个搜索器登陆某一网页,就可以从网页摘录内容并进行储存。在搜索过程中会出现大量阻碍,组织搜索引擎从网页摘录信息。普遍问题包括所有的flash网站、多媒体网页,比如没有文本信息的视频和图像,以及技术网站,比如AJAX,这类网站搜索引擎在分析时可能比较困难。一种常规方法就是如果你使用先进的强化技术去研发网站的话,这种先进强化技术可以帮助残疾或轮椅访客登陆网站,那么搜索引擎也可以访问网站内容。
索引
搜索器一旦访问网页并摘录内容之后,搜索引擎就会考虑到底需不需要储存这些内容。如果它们认为这些内容大多都比较空洞或者说价值不大,那么通常不会储存网页(比如,这些网页或许是网站上其他网页内容的总和)。重复内容的其中一个普遍原因就是合并。
排行
搜索和索引问题都涉及技术层面。网络开发商知道这些进程非常关键,这样才能确保网站的技术结构不会阻止搜索引擎站点。相比之下,排行主要依赖于网页和所给的查询之间的相关性。如果你在建立搜索者角色,并将搜索资料植入产品研发过程中,那么你已经在采取重大步骤,确保网页尽可能和目标搜索者的需求相关。正如上述所提到的,相关、权威的链接也可以帮助搜索引擎了解网页的价值。只要提供有用内容并采取成功的营销策略,这些都不是问题。