特定のHTMLタグのみ表示を許可

エスケープ処理

概要

 閲覧数:2139  投稿日:2014-05-16  更新日:2014-06-05  

特定のHTMLタグのみ表示を許可
・許可するタグは配列で指定
・例 … h1、h2、h3、strong、a、p
・上記以外のタグは、HTMLエンティティへ置換せず削除

※デモのh3タグは、わざと閉じていない


コード

function filter_text($text, $allow_tags = array()) {
 
    $tags = implode('|', $allow_tags);
    $attr = '(?: ++[\\w-]++(?:=(?:[\\w-]++|"[^"]*+"|\'[^\']*+\'))?+)';
    $keep = $tags !== '' ?
        "</(?:{$tags}) *+>|<(?:{$tags}){$attr}*+ *+/? *+>|":
        ''
    ;
    $pattern = "@{$keep}(</[\\w-]++ *+>|<[\\w-]++{$attr}*+ *+/? *+>|<[^<>]*+>|[<>])@i";
    return preg_replace_callback($pattern, function ($matches) {
        switch (true) {
            case isset($matches[1]): return '';
            default:                 return $matches[0];
        }
    }, $text);
 
}
 
$text='<><a href="http://hogehoge.com/><><"><B><b myattr="<><>">hogehoge<i>hoge<ins>hoge</ins></i></b></B><b<b<b>>><h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>><span class="hoge">h3タグ</span>も許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても<br>今日はよい天気だよ';

$allow_tags = array("h1","h2","h3","strong","a","p");
 
$result = filter_text($text, $allow_tags);
print_r($result);



結果

<a href="http://hogehoge.com/><><">hogehogehogehogebb<h1>h1タグだけ許可</h1><h2 style="padding:15px;">h2タグも許可</h2><h3>h3タグも許可<p><strong>ホワイトリスト方式</strong>とか超分わからない。だけど分からないからと言って放っておいてもいつまでも分からないままなので、とりあえず簡単なデモを設置することから始めてみようか。リンクは<a href="http://phpcode.w4c.work">こちら</a></p><h3>それにしても今日はよい天気だよ








クロスサイトスクリプティング対策

特定のHTMLタグのみ(aタグは除く)表示を許可



週間人気ページランキング / 11-16 → 11-22
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 8
1 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 8
2 URLから、トップページ(index.html)判定 | ルーティング 6
3 指定文字列より前を取得 | 文字列(テキスト処理) 5
4 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 4
5 現在WebページのURLパスを第2階層まで取得 | パス 3
5 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 3
5 2 つの配列(文字列とdatetime)が要素順で 対応している時、日付を整形して 新しい配列を作成 | 配列(型) 3
6 再帰処理で平坦な連想配列をツリー化 | 多次元配列(型) 2
6 「1週間後の年月日時分秒」を表示 … time() | 日付および時刻関連 2
6 投稿日時をTwitterのように「★分前」「★時間前」という文字列変換するユーザ定義PHP関数 | 日付および時刻関連 2
6 配列要素を、文字列連結して表示(元配列を上書) … foreach文+implode | 配列(型) 2
6 8桁の生年月日数字から、年齢を計算 | 日付および時刻関連 2
6 null代入とunset()の違い | 変数 2
6 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 2
7 配列定数同士をarray_mergeで後ろに単純連結(キーは新たに振り直す) | 定数 1
7 gethostbyaddr / IPアドレスからホスト名を取得 | ネットワーク 関数 1
7 マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する | テキスト処理 1
7 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 1
2024/11/23 1:02 更新