特定のHTMLタグのみ表示を許可

エスケープ処理

概要

 閲覧数:2191  投稿日:2014-05-16  更新日:2014-06-05  

特定のHTMLタグのみ表示を許可
・許可するタグは配列で指定
・例 … h1、h2、h3、strong、a、p
・上記以外のタグは、HTMLエンティティへ置換せず削除

※デモのh3タグは、わざと閉じていない


コード

function filter_text($text, $allow_tags = array()) {
 
    $tags = implode('|', $allow_tags);
    $attr = '(?: ++[\\w-]++(?:=(?:[\\w-]++|"[^"]*+"|\'[^\']*+\'))?+)';
    $keep = $tags !== '' ?
        "</(?:{$tags}) *+>|<(?:{$tags}){$attr}*+ *+/? *+>|":
        ''
    ;
    $pattern = "@{$keep}(</[\\w-]++ *+>|<[\\w-]++{$attr}*+ *+/? *+>|<[^<>]*+>|[<>])@i";
    return preg_replace_callback($pattern, function ($matches) {
        switch (true) {
            case isset($matches[1]): return '';
            default:                 return $matches[0];
        }
    }, $text);
 
}
 
$text='<><a href="http://hogehoge.com/><><"><B><b myattr="<><>">hogehoge<i>hoge<ins>hoge</ins></i></b></B><b<b<b>>><h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>><span class="hoge">h3タグ</span>も許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても<br>今日はよい天気だよ';

$allow_tags = array("h1","h2","h3","strong","a","p");
 
$result = filter_text($text, $allow_tags);
print_r($result);



結果

<a href="http://hogehoge.com/><><">hogehogehogehogebb<h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>h3タグも許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても今日はよい天気だよ








クロスサイトスクリプティング対策

特定のHTMLタグのみ(aタグは除く)表示を許可



週間人気ページランキング / 1-30 → 2-5
順位 ページタイトル抜粋 アクセス数
1 URLから、トップページ(index.html)判定 | ルーティング 11
2 24時間以降の時刻を表示 / "02:30" → "26:30" | 日付および時刻関連 5
3 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 4
3 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 4
3 8桁の生年月日数字を分解 | 文字列(テキスト処理) 4
3 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 現在WebページのURLパスを第2階層まで取得 | パス 3
4 「指定文字」直後から「指定文字」直前までの文字列を返す | マルチバイト文字列(テキスト処理) 3
4 null代入とunset()の違い | 変数 3
4 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 3
5 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 2
5 日付表示(フォーマット指定) | 日付および時刻関連 2
5 foreach内で一度「true」判定された後、次回以降「false」にする仕組みがないと、foreachの度に「true」「false」判定することができない | 条件分岐 2
5 配列の空要素を削除 / array_diff()で空配列と比較し配列の差分を返す | 配列(型) 2
5 多次元配列で「二次元目の最大値 +1 」 を返す | 配列(型) 2
5 指定文字列より前を取得 | 文字列(テキスト処理) 2
5 foreachの中でswitch文 | 配列(型) 2
6 指定配列キーの重複数をカウント | 配列(型) 1
6 Smartyのテンプレートにincludeしたファイルを表示 | Smarty(テンプレートエンジン) 1
6 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 1
2025/2/6 1:02 更新