先上代码
regexp_replace("source_html",'\s*(<[^>]+>|<script.+?<\/script>|<style.+?<\/style>)\s*','','gi')
作用,使用regexp_replace函数,清理html标签,也包括整个<script>…</script>, <style>…</style>的代码块。
先上代码
regexp_replace("source_html",'\s*(<[^>]+>|<script.+?<\/script>|<style.+?<\/style>)\s*','','gi')
作用,使用regexp_replace函数,清理html标签,也包括整个<script>…</script>, <style>…</style>的代码块。
”删除字符串中所有html标记,包括javascript及css代码区块,同时删除换行符
” by fengyqf 20100929
Function RemoveHTML(str)
Dim objRegExp, Match,strHTML
if isnull(str) then
str=””
end if
strHTML=str
strHTML=replace(replace(replace(strHTML,vblf,””),vbcr,””),vbcrlf,””)
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = “<script[^>]*?>.*?</script>”
strHTML = objRegExp.Replace(strHTML,””)
objRegExp.Pattern = “<style[^>]*?>.*?</style>”
strHTML = objRegExp.Replace(strHTML,””)
objRegExp.Pattern = “<.+?>”
strHTML = objRegExp.Replace(strHTML,””)
Set objRegExp = Nothing
RemoveHTML=strHTML
End Function
UE默认使用UltraEdit正则表达式,就是UE自己改造过的正则语法,跟常用的perl兼容正则表达式语法不一致,所以即使写对了正则表达式,还会显示“查询的字符串未找到”。
这就需要修改UE的正则引擎为Perl引擎,方法如下:
在crtl+f,在“查找”对话框里点右下角的“高级”按钮,下面长出来部分的“正则表达式引擎”勾选perl,即可以。
如下图所示:
[附注] 网上有文章如是说
——————————–
用UltraEdit打开文本,首先到菜单中选择正则表达式引擎,正则表达式引擎分支位于“配置 – 搜索”之下,有如下选项: