特定のHTMLタグのみ表示を許可

エスケープ処理

概要

 閲覧数:2219  投稿日:2014-05-16  更新日:2014-06-05  

特定のHTMLタグのみ表示を許可
・許可するタグは配列で指定
・例 … h1、h2、h3、strong、a、p
・上記以外のタグは、HTMLエンティティへ置換せず削除

※デモのh3タグは、わざと閉じていない


コード

function filter_text($text, $allow_tags = array()) {
 
    $tags = implode('|', $allow_tags);
    $attr = '(?: ++[\\w-]++(?:=(?:[\\w-]++|"[^"]*+"|\'[^\']*+\'))?+)';
    $keep = $tags !== '' ?
        "</(?:{$tags}) *+>|<(?:{$tags}){$attr}*+ *+/? *+>|":
        ''
    ;
    $pattern = "@{$keep}(</[\\w-]++ *+>|<[\\w-]++{$attr}*+ *+/? *+>|<[^<>]*+>|[<>])@i";
    return preg_replace_callback($pattern, function ($matches) {
        switch (true) {
            case isset($matches[1]): return '';
            default:                 return $matches[0];
        }
    }, $text);
 
}
 
$text='<><a href="http://hogehoge.com/><><"><B><b myattr="<><>">hogehoge<i>hoge<ins>hoge</ins></i></b></B><b<b<b>>><h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>><span class="hoge">h3タグ</span>も許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても<br>今日はよい天気だよ';

$allow_tags = array("h1","h2","h3","strong","a","p");
 
$result = filter_text($text, $allow_tags);
print_r($result);



結果

<a href="http://hogehoge.com/><><">hogehogehogehogebb<h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>h3タグも許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても今日はよい天気だよ








クロスサイトスクリプティング対策

特定のHTMLタグのみ(aタグは除く)表示を許可



週間人気ページランキング / 3-4 → 3-10
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 9
2 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 8
3 指定文字列より前を取得 | 文字列(テキスト処理) 5
3 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 5
4 現在WebページのURLパスを第2階層まで取得 | パス 4
4 8桁の生年月日数字を分解 | 文字列(テキスト処理) 4
4 多次元配列の作成 | 多次元配列(型) 4
5 URLから、トップページ(index.html)判定 | ルーティング 3
6 配列の要素に特定の値が存在すれば、要素のキーを返す array_search() | 配列(型) 2
6 24時間以降の時刻を表示 / "02:30" → "26:30" | 日付および時刻関連 2
6 (データベースなどから取得した)多次元配列の値と、一次元配列を比較して、「一致」及び「増減」を返す | 配列(型) 2
6 「指定文字」直後から「指定文字」直前までの文字列を返す | マルチバイト文字列(テキスト処理) 2
7 Smartyのテンプレートにincludeしたファイルを表示 | Smarty(テンプレートエンジン) 1
7 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 1
7 null代入とunset()の違い | 変数 1
7 特定のHTMLタグのみ表示を許可 | エスケープ処理 1
7 平均値、分散、標準偏差を求める | 統計 1
7 アルファベット小文字に続けて大文字表示 | 文字列(テキスト処理) 1
7 range( ) を使用して日付期間を配列生成 | 日付および時刻関連 1
7 unset | タグ毎エントリー一覧 1
2025/3/11 1:02 更新