特定のHTMLタグのみ表示を許可

エスケープ処理

概要

 閲覧数:2081  投稿日:2014-05-16  更新日:2014-06-05  

特定のHTMLタグのみ表示を許可
・許可するタグは配列で指定
・例 … h1、h2、h3、strong、a、p
・上記以外のタグは、HTMLエンティティへ置換せず削除

※デモのh3タグは、わざと閉じていない


コード

function filter_text($text, $allow_tags = array()) {
 
    $tags = implode('|', $allow_tags);
    $attr = '(?: ++[\\w-]++(?:=(?:[\\w-]++|"[^"]*+"|\'[^\']*+\'))?+)';
    $keep = $tags !== '' ?
        "</(?:{$tags}) *+>|<(?:{$tags}){$attr}*+ *+/? *+>|":
        ''
    ;
    $pattern = "@{$keep}(</[\\w-]++ *+>|<[\\w-]++{$attr}*+ *+/? *+>|<[^<>]*+>|[<>])@i";
    return preg_replace_callback($pattern, function ($matches) {
        switch (true) {
            case isset($matches[1]): return '';
            default:                 return $matches[0];
        }
    }, $text);
 
}
 
$text='<><a href="http://hogehoge.com/><><"><B><b myattr="<><>">hogehoge<i>hoge<ins>hoge</ins></i></b></B><b<b<b>>><h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>><span class="hoge">h3タグ</span>も許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても<br>今日はよい天気だよ';

$allow_tags = array("h1","h2","h3","strong","a","p");
 
$result = filter_text($text, $allow_tags);
print_r($result);



結果

<a href="http://hogehoge.com/><><">hogehogehogehogebb<h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>h3タグも許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても今日はよい天気だよ








クロスサイトスクリプティング対策

特定のHTMLタグのみ(aタグは除く)表示を許可



週間人気ページランキング / 9-1 → 9-7
順位 ページタイトル抜粋 アクセス数
1 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 16
1 現在WebページのURLパスを第2階層まで取得 | パス 16
2 URLから、トップページ(index.html)判定 | ルーティング 15
3 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 11
4 指定文字列より前を取得 | 文字列(テキスト処理) 8
5 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 5
5 「input type="datetime-local"」で受け取った文字列をハイフンへ変更 | 日付および時刻関連 5
5 8桁の生年月日数字を分解 | 文字列(テキスト処理) 5
6 配列の空要素を削除 / array_diff()で空配列と比較し配列の差分を返す | 配列(型) 4
6 switch文判定 … 「in_array」「array_keys」 | 配列(型) 4
6 null代入とunset()の違い | 変数 4
6 foreachの中でswitch文 | 配列(型) 4
6 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 4
6 24時間以降の時刻を表示 / "02:30" → "26:30" | 日付および時刻関連 4
7 (データベースなどから取得した)多次元配列の値と、一次元配列を比較して、「一致」及び「増減」を返す | 配列(型) 3
7 n | タグ毎エントリー一覧 3
7 文字列に含まれるすべての半角空白と全角空白を削除 | テキスト処理 3
7 配列の空要素を削除した後、添字を振り直す … array_diff() | 配列(型) 3
7 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 3
7 多次元配列キーを、多次元配列内にある「特定キーの値」へ変更 | 多次元配列(型) 3
2024/9/8 1:02 更新