核心代码:

<?php// $document 应包含一个 HTML 文档。// 本例将去掉 HTML 标记,javascript 代码// 和空白字符。还会将一些通用的// HTML 实体转换成相应的文本。$search = array (""<script[^>]*?>.*?</script>"si", // 去掉 javascript         ""<[/!]*?[^<>]*?>"si",      // 去掉 HTML 标记         ""([])[s]+"",         // 去掉空白字符         ""&(quot|#34);"i",         // 替换 HTML 实体         ""&(amp|#38);"i",         ""&(lt|#60);"i",         ""&(gt|#62);"i",         ""&(nbsp|#160);"i",         ""&(iexcl|#161);"i",         ""&(cent|#162);"i",         ""&(pound|#163);"i",         ""&(copy|#169);"i",         ""&#(d+);"e");          // 作为 PHP 代码运行$replace = array ("",         "",         "\1",         """,         "&",         "<",         ">",         " ",         chr(161),         chr(162),         chr(163),         chr(169),         "chr(\1)");$text = preg_replace ($search, $replace, $document);?>