特定のHTMLタグのみ表示を許可

エスケープ処理

概要

 閲覧数:2448  投稿日:2014-05-16  更新日:2014-06-05  

特定のHTMLタグのみ表示を許可
・許可するタグは配列で指定
・例 … h1、h2、h3、strong、a、p
・上記以外のタグは、HTMLエンティティへ置換せず削除

※デモのh3タグは、わざと閉じていない


コード

function filter_text($text, $allow_tags = array()) {
 
    $tags = implode('|', $allow_tags);
    $attr = '(?: ++[\\w-]++(?:=(?:[\\w-]++|"[^"]*+"|\'[^\']*+\'))?+)';
    $keep = $tags !== '' ?
        "</(?:{$tags}) *+>|<(?:{$tags}){$attr}*+ *+/? *+>|":
        ''
    ;
    $pattern = "@{$keep}(</[\\w-]++ *+>|<[\\w-]++{$attr}*+ *+/? *+>|<[^<>]*+>|[<>])@i";
    return preg_replace_callback($pattern, function ($matches) {
        switch (true) {
            case isset($matches[1]): return '';
            default:                 return $matches[0];
        }
    }, $text);
 
}
 
$text='<><a href="http://hogehoge.com/><><"><B><b myattr="<><>">hogehoge<i>hoge<ins>hoge</ins></i></b></B><b<b<b>>><h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>><span class="hoge">h3タグ</span>も許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても<br>今日はよい天気だよ';

$allow_tags = array("h1","h2","h3","strong","a","p");
 
$result = filter_text($text, $allow_tags);
print_r($result);



結果

<a href="http://hogehoge.com/><><">hogehogehogehogebb<h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>h3タグも許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても今日はよい天気だよ








クロスサイトスクリプティング対策

特定のHTMLタグのみ(aタグは除く)表示を許可



週間人気ページランキング / 12-19 → 12-25
順位 ページタイトル抜粋 アクセス数
1 指定文字列より前を取得 | 文字列(テキスト処理) 3
1 日付文字列を比較して、年月日が異なる場合は年月日を、同一年の場合は月日を返す、同一年月の場合は月日を返す。※1日を厳密に直近24時間以内で判定 | 日付および時刻関連 3
2 array_walk第3引数を指定して、コールバック関数へ第3引数を渡す | 配列(型) 2
2 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 2
2 配列の要素に特定の値が存在すれば、要素のキーを返す array_search() | 配列(型) 2
2 文字列に含まれるすべての半角空白と全角空白を削除 | テキスト処理 2
2 現在WebページのURLパスを第2階層まで取得 | パス 2
2 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 2
2 クロスサイトスクリプティング対策(配列対応) | エスケープ処理 2
3 session_start | タグ毎エントリー一覧 1
3 array_merge | タグ毎エントリー一覧 1
3 「数字が格納されている変数」の型を確認 | 型 1
3 preg_split | タグ毎エントリー一覧 1
3 マテリアルカラーをランダムに3色取得 / 重複も許容 | 色 1
3 switch文判定 … 「in_array」「array_keys」 | 配列(型) 1
3 対象文字列へ対して、一致したすべての文字列を置換する標準関数 / str_replace | 文字列(テキスト処理) 1
3 (データベースなどから取得した)多次元配列の構造を変換して一次元配列を返す | 多次元配列(型) 1
3 「input type="datetime-local"」で受け取った文字列をハイフンへ変更 | 日付および時刻関連 1
3 mb_strpos | タグ毎エントリー一覧 1
3 配列要素をそれぞれ置換(引数の数 … 不一致) | 配列(型) 1
2025/12/26 1:02 更新