优化动态网站有什么方法 确保网站安全要注意以下几点
优化动态网站有什么方法
一、动态网站的出现和优势
最早互联网出现时,站点内容都是以HTML静态页面形式存放在服务器上,访问者浏览到的页面都是这些实际存在的静态页面。随着技术的发展,特别是数据库和脚本技术PERL、ASP、PHP和JSP的发展,越来越多的站点都开始采取动态的页面发布手段。比如,我们在Google.COM上搜索一个内容,得到的搜索结果页面文件"本身"在Google服务器上并不存在,而是通过程序在我们输入搜索内容时调用后台数据库实时生成的,也就是说,这些结果页面是动态的。
静态页面的站点只涉及文件的传输问题,而动态站点则复杂得多,用户和站点之间出现大量的交互,网站不再仅仅是内容的发布,而是成为了一种"应用(Application)",是软件业向互联网上的扩张,从软件的角度看,动态站点是逻辑应用层和数据层的分离,数据库负责站点数据的存储管理,而ASP、PHP、JSP等负责处理站点的逻辑应用。这样做的好处除了增加很多交互功能外,更重要的是站点的维护、更新和升级都方便了许多。可以说,没有动态网站技术,目前互联网上的这些超大型站点就不可能出现。
二、搜索引擎抓取动态网站页面时面临的问题
从用户的角度看,动态网站非常不错,丰富了站点的功能,但是对于搜索引擎来说,情况就不同了。(关于搜索引擎和分类目录的区别,以及搜索引擎的工作原理,
根本的问题在于"输入"和"选择",动态页面是在用户"输入内容"或者进行"选择"时动态生成的,但是搜索引擎的"搜索机器人"无法"输入"和"选择"。比如我们要在当当书店站点查看冯英健的《网络营销基础与实践》一书,介绍页面是动态生成的,这里在"?"后面的product_id参数值需要我们输入的,"搜索机器人"可以通过链接找到页面,但是它无法输入"?"后面的product_id参数值,从而无法抓取这个页面文件。
另外,对于通过链接达到这种带"?"的页面,技术上搜索引擎可以抓取,但是一般情况下搜索引擎选择不去抓取,这是为了避免一种叫"搜索机器人陷阱(spider traps)"的脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出而浪费时间。
【东莞网站优化 www.madeindongguan.com】
三、动态网站的搜索引擎策略
动态网站要被搜索引擎抓取,可以采用内容发布系统软件将动态站点转化成静态页面,这种办法对于页面发布后变动少的站点比较合适,比如一些新闻类的站点。
一般的动态网站可以通过下面的办法让搜索引擎抓取:首先,我们要让动态页面的URL地址中没有"?",让动态页面看上去象"静态页面"。这明显是一个动态页面,但是URL地址看上去却象"静态页面"。针对不同的动态技术可以采用下面技术实现:
·对于采用ASP技术的动态页面Exception Digital公司提供一种工具叫着XQASP可以将"?"替换为"/"。
·对于采用ColdFusion技术的站点,需要重新配置服务器上的ColdFusion,用"/"代替"?"将参数传输到URL, ·对于使用Apache服务器的站点,可以使用rewrite模块将带参数的URL地址转换成搜索引擎支持的形式,该模块mod_rewrite在Apache服务器中不是缺省安装的,
对于其他的动态技术也能找到对应的方法改变URL的形式。
然后,要创建一些静态页面指向这些动态页面(以改变过的URL链接)。前面说过,搜索引擎机器人并不会自己"输入"参数,所以要让上面这些动态页面被搜索引擎抓取,我们还需要告诉机器人这些页面的地址(也就是参数)。我们可以创建一些静态的页面,一般在网络营销中称? "gateway page"(入口页面),这些页面上有大量指向这些动态页面的链接。
将这些入口页面的地址提交到搜索引擎,这些页面和链接的动态页面(改变过URL形式)就能都被搜索引擎抓取了。
四、搜索引擎对动态网站支持的改进
在我们调整动态站点适应搜索引擎的同时,搜索引擎也在发展。到目前为止,绝大多数的搜索引擎还不支持动态页面的抓取,但是Google、HOTBOT等和国内的百度开始尝试抓取动态网站页面(包括? "?"的页面),这就是我们现在在这些搜索引擎进行搜索时,结果中出现动态链接的原因。
这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱",都只抓取从静态页面(至少"看上去"是静态的页面)链接到的动态页面,而从动态页面链接出的动态页面都不再抓取。
所以一个动态站点如果只针对上面这些搜索引擎,可以在上面小节介绍方法的基础上简化:只用创建一些入口页面,链接很多动态页面,然后将这些入口页面递交到这些搜索引擎就可以了。
确保网站安全要注意以下几点
不要在国内注册域名,更不要注册.cn域名
这个杯具的事情无须再提,不管是从价格还是管理域名的便捷性上我早就开始在name.com注册域名,而在国内注册的域名一般是确定若干个月或者一两年要出售的.com域名,ename.cn是唯一的选择。这几天name.com和狗他爹(注:Godaddy)都在搞活动,狗他爹甚至推出了0.99美元的域名和支付宝,但是狗他爹注册域名和以后的转移已经续费都不如Name.com,甚至还会有额外的手续费,所以我还是注册的时候多花几刀省事。
不要使用免费的空间
国内最著名的免费空间“门户通”已经宣布暂定免费主机业务,还好虎翼网还能拿回自己的IDC让用户下载自己网站和数据库,还好他们还能拿回自己的数据,还能弥补网站不能访问的一两天时间。可怜我的QQ头像辛辛苦苦做了几个好词到百度和Google首页了,如今被K的回到解放前了。
选择合适的机房和IDC公司
这次“整顿”也算是对IDC市场的一次洗牌,像我这样拿出多余的主机租用的伪IDC肯定慢慢的被市场淘汰的。纵观本次“整顿”和以前若干次“整顿”,河南和江西等地机房因为位于南北交接并且价格低廉的缘故已经成为被打击的重灾区。这其中九江、郑州等地的机房是典型的代表,我以前差一点就把服务器托管在了河南二长网通机房,否则我此刻就如坐针毡了。这一点我只能说我选择的这个机房相对比较安全,其他由于太多无法预知的因素恕不能妄言。
放在国内的网站慎用论坛程序
虽然博客和论坛都是被打击的对象,但是不管是Zblog还是WordPress的留言过滤系统还是非常出色的,而Discuz和PHPwind等论坛程序上出现“不良”信息的几率很大,很多老外的XX网站都是群发的,不小心被挂上点XX图片那某些人就会很生气的,自己挂了还得牵连别人就不是好童鞋了。如果已经用了论坛的,就得多花点精力监管网站等待面朝大海春暖花开的那一天了。
|