不知道大家注意到了没有,Google和Baidu网页的HTML源代码是混合在一起的。HTML代码混合在一起,出发点是为了减小网页体积,从而加快网页加载速度。
写个函数把网页HTML源代码的换行符和空格过滤掉其实并不难,我这里是写了个基类,在asp.net编程时,页面只要继承这个基类,那么输出的HTML代码就会自动去掉换行符,和多余的空格符号,例如“> <”之间的空格符号。
using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.HtmlControls;
using System.Text.RegularExpressions;
using System.IO;
/// <summary>
/// PageBase 页面基类
/// </summary>
public class PageBase : System.Web.UI.Page
{
protected override void Render(HtmlTextWriter writer)
{
StringWriter sw = new StringWriter();
HtmlTextWriter htmlWriter = new HtmlTextWriter(sw);
base.Render(htmlWriter);
string html = sw.ToString();
html = Regex.Replace(html, "[\f\n\r\t\v]", "");
html = Regex.Replace(html, " {2,}", " ");
html = Regex.Replace(html, ">[ ]{1}", ">");
writer.Write(html);
}
}
☉Request.Cookies.Remove()无法删除cookie的解决办法 (asp.net) (2009-11-20 19:43:5)
☉如何使用asp.net(c#)下载Excel文件 (2009-11-18 19:21:29)
☉IP反查域名/主机名的ASP.NET源代码 (2009-10-28 15:58:5)
☉asp.net实现通过域名或主机名获得IP地址 (2009-10-28 15:50:20)
☉asp.net(c#)中实现ping功能 (2009-9-7 3:41:46)
☉c#利用WebClient和WebRequest获取网页源代码的比较 (2009-7-15 13:28:21)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。