ASP.NET過濾HTML標簽只保留換行與空格的方法
來源:易賢網(wǎng) 閱讀:779 次 日期:2015-01-16 15:38:14
溫馨提示:易賢網(wǎng)小編為您整理了“ASP.NET過濾HTML標簽只保留換行與空格的方法”,方便廣大網(wǎng)友查閱!

本文實例講述了ASP.NET過濾HTML標簽只保留換行與空格的方法。分享給大家供大家參考。具體分析如下:

自己從網(wǎng)上找了一個過濾HTML標簽的方法,我也不知道誰的才是原創(chuàng)的,反正很多都一樣。我把那方法復制下來,代碼如下:

復制代碼 代碼如下:/// <summary>

/// 去除HTML標記

/// </summary>

/// <param name="NoHTML">包括HTML的源碼 </param>

/// <returns>已經(jīng)去除后的文字</returns>

public static string NoHTML(string Htmlstring)

{

//刪除腳本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

RegexOptions.IgnoreCase);

//刪除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

Htmlstring.Replace("\r\n", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;

}

以上代碼是從網(wǎng)上直接復制過來的,這個確實能過濾掉所有的HTML標簽,但是這個不是我想要的,這個過濾得太干凈了,我如果用textarea輸入框的話,我是要保留空格跟換行的。

然后我就自己改了一下這個方法,textarea的換行是\n,所以我得把這些標簽重新匹配替換成<br>,這樣的話從數(shù)據(jù)庫中讀取到頁面時,就能正確的換行了,把空格替換成HTML的空格符,大功告成。

復制代碼 代碼如下:/// <summary>

/// 去除HTML標記(保留br跟\r\n)

/// </summary>

/// <param name="NoHTML">包括HTML的源碼 </param>

/// <returns>已經(jīng)去除后的文字</returns>

public static string NewNoHTML(string Htmlstring)

{

//Htmlstring.Replace("", "%r%n").Replace("<br>","%br%").Replace("<br/>","%br&%").Replace("");

//刪除腳本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

RegexOptions.IgnoreCase);

//刪除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

//Htmlstring.Replace("\r\n", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring);

Htmlstring = Regex.Replace(Htmlstring, @"((\r\n))", "<br>");

Htmlstring = Regex.Replace(Htmlstring, @"(\r|\n)", "<br>");

Htmlstring = Regex.Replace(Htmlstring, @"(\s)", " ");

return Htmlstring;

}

這個過濾可以用于讓用戶輸入發(fā)布內(nèi)容時的過濾。

希望本文所述對大家的asp.net程序設計有所幫助。

更多信息請查看IT技術專欄

更多信息請查看網(wǎng)絡編程
易賢網(wǎng)手機網(wǎng)站地址:ASP.NET過濾HTML標簽只保留換行與空格的方法

2025國考·省考課程試聽報名

  • 報班類型
  • 姓名
  • 手機號
  • 驗證碼
關于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 新媒體/短視頻平臺 | 手機站點 | 投訴建議
工業(yè)和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網(wǎng)安備53010202001879號 人力資源服務許可證:(云)人服證字(2023)第0102001523號
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關注公眾號:hfpxwx
咨詢QQ:1093837350(9:00—18:00)版權所有:易賢網(wǎng)