用正则表达式写的HTML分离函数

2016-01-29 18:24 15 1 收藏

用正则表达式写的HTML分离函数,用正则表达式写的HTML分离函数

【 tulaoshi.com - ASP 】

  存成.asp文件,执行,你用ASPHTTP抓内容的时候用这个很爽,当然自己要改进一下了

<%
Option Explicit

Function stripHTML(strHTML)
'Strips the HTML tags from strHTML

  Dim objRegExp, strOutput
  Set objRegExp = New Regexp

  objRegExp.IgnoreCase = True
  objRegExp.Global = True
  objRegExp.Pattern = "<.+?"

  'Replace all HTML tag matches with the empty string
  strOutput = objRegExp.Replace(strHTML, "")
  
  'Replace all < and with &lt; and &gt;
  strOutput = Replace(strOutput, "<", "&lt;")
  strOutput = Replace(strOutput, "", "&gt;")
  
  stripHTML = strOutput    'Return the value of strOutput

  Set objRegExp = Nothing
End Function


%

<form method="post" id=form1 name=form1
  <bEnter an HTML String:</b<br
  <textarea name="txtHTML" cols="50" rows="8" wrap="virtual"<%=Request("txtHTML")%</textarea
  <p
  <input type="submit" value="Strip HTML Tags!" id=submit1 name=submit1
</form

<% if Len(Request("txtHTML")) 0 then %
    <p<hr<p
    <b<uView of string <iwith no</i HTML stripping:</u</b<br
    <xmp
    <%=Request("txtHTML")%
    </xmp<p
    <b<uView of string <iwith</i HTML stripping:</u</b<br
    <pre
    <%=StripHTML(Request("txtHTML"))%
    </pre
<% End If %

 

来源:http://www.tulaoshi.com/n/20160129/1505637.html

延伸阅读
标签: Web开发
一、清楚内容中的Javsscript 代码 代码如下: Function ClearJSCode(originCode) Dim reg set reg = New RegExp reg.Pattern = "SCRIPT[^]*/SCRIPT" reg.IgnoreCase = True reg.Global = True clearJSCode = reg.Replace(originCode, "") End Function 二、清除内容中的HTML代码   代码如下: Function ClearHTMLCode(origi...
标签: Web开发
    public string DealHtml(string str) { //str = Regex.Replace(str, @"(img)[^]*|/(img)", "", RegexOptions.IgnoreCase); str = Regex.Replace(str, @"(table|tbody|tr|td|th)[^]*|/(table|tbody|tr|td|th)", "", RegexOptions.IgnoreCase); str = Regex.Replace(str, @"(div|blockquote|fieldset|legend)[^]*|/(div|blockq...
标签: Web开发
正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为元字符)。模式描述在搜索文本时要匹配的一个或多个字符串。   正则表达式示例 表达式 匹配 /^\s*$/ 匹配空行。 /\d{2}-\d{5}/ 验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。 /\s*(\S+)(\s[^]*)?[\s\S]*\s*\/\1\s*/ ...
标签: Web开发
正则表达式在PHP中被用来处理复杂的文字串。支持正则表达式的函数有: ereg()ereg replace()eregi replace()split() 这些函数都将正则表达式作为他们的第一个参数。PHP使用POSIX扩展规则表达式(使用POSIX 1003.2)。要找到所有的关于POSIX扩展规则表达式的描述,请查看包括在PHP发行版本之内的regex man页面。 Examp...
正则表达式简介 翻译:NorthTibet 原文出处:Regular Expressions 有些新手对正则表达式不是很熟悉,有必要在此作一简单回顾。如果你是正则表达式高手,可以不用看这一部分。 正则表达式是描述字符串集的字符串。例如,正则表达式“Mic*”描述所有包含“Mic”,后跟零个或多个字符的字符串。Mickey、Microsoft、Michelangelo...

经验教程

331

收藏

49

精华推荐

正则表达式验证

正则表达式验证

Dear丶宠儿

正则表达式基础

正则表达式基础

今晩报

IP 正则表达式验证

IP 正则表达式验证

走过忧伤的精灵

微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部