マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する

テキスト処理

 閲覧数:373  投稿日:2023-01-08  更新日:2023-02-23  

< 最終的に採用した方法 >
マークダウンからHTMLへ戻した後、strip_tagsでaタグごと削除。

< 最初に考えたこと >
マークダウンからURLを削除したい。
→ 正規表現を使用するしかない。速度を考慮するとなるべく避けたい。

< 次に考えたこと >
エスケープすればよいのでは?
→ エスケープすると、エスケープされた文字('<b>'など)が残ってしまう。


コード

require_once '/var/www/html/lib/composer/vendor/autoload.php';
$parser = new \cebe\markdown\GithubMarkdown();
$parser->html5 = true;
$parser->enableNewlines = true;

//ここからが本題
$targetStr = "「A」は「B」と「C」です。「[F](https://example.com/1)」や「[G](https://example.com/2)……";
echo strip_tags($parser->parse($targetStr));



結果

"「A」は「B」と「C」です。「F」や「G……"



タグ


strip_tags 



複数の指定文字列を削除

文字列に含まれるすべての半角空白と全角空白を削除



類似度ページランキング
順位 ページタイトル抜粋
1 マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する 89
2 マークダウンで「> 引用」を、HTMLエスケープ後、
へHTML変換
33
3 配列のキーをランダムに取得する array_rand() 29
4 日付(文字列)から、指定時刻のUNIXタイムスタンプを取得 28
5 (データベースなどから取得した)多次元配列の構造を変換して一次元配列を返す 28
6 現在WebページのURLパスを第2階層まで取得 28
7 特定のHTMLタグのみ(aタグは除く)表示を許可 27
8 配列の中より、「ランダム」かつ「重複することなく」複数の値を抽出 27
9 配列内よりランダムに要素(例えば画像URL)を取得 27
10 URLから、トップページ(index.html)判定 26
11 現在URLのホスト名を取得 25
12 配列のキーを取得する array_keys() 24
13 文章の改行を削除する。既存改行やスペース等の区切りは全て1つの半角スペースへ変更 24
14 (データベースなどから取得した)多次元配列の値と、一次元配列を比較して、「一致」及び「増減」を返す 24
15 文字列に含まれるすべての半角空白と全角空白を削除 24
16 UNIXのタイムスタンプから日付(文字列)を取得後、「アクセスした時点の年月日時分秒」を整形して表示 … date() 23
17 'xxxx_数字'キーの数だけ、数字毎に分けて二次元配列へ格納(キーのサフィックスは削除する) / array_walk 23
18 再帰処理で平坦な連想配列をツリー化 23
19 配列の空要素を削除した後、添字を振り直す … array_diff() 23
20 キーを格納した配列と値を格納した配列で1つの配列を作成する array_combine() 23
2024/11/23 6:45 更新
週間人気ページランキング / 11-16 → 11-22
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 8
1 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 8
2 URLから、トップページ(index.html)判定 | ルーティング 6
3 指定文字列より前を取得 | 文字列(テキスト処理) 5
4 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 4
5 現在WebページのURLパスを第2階層まで取得 | パス 3
5 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 3
5 2 つの配列(文字列とdatetime)が要素順で 対応している時、日付を整形して 新しい配列を作成 | 配列(型) 3
6 再帰処理で平坦な連想配列をツリー化 | 多次元配列(型) 2
6 「1週間後の年月日時分秒」を表示 … time() | 日付および時刻関連 2
6 投稿日時をTwitterのように「★分前」「★時間前」という文字列変換するユーザ定義PHP関数 | 日付および時刻関連 2
6 配列要素を、文字列連結して表示(元配列を上書) … foreach文+implode | 配列(型) 2
6 8桁の生年月日数字から、年齢を計算 | 日付および時刻関連 2
6 null代入とunset()の違い | 変数 2
6 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 2
7 配列定数同士をarray_mergeで後ろに単純連結(キーは新たに振り直す) | 定数 1
7 gethostbyaddr / IPアドレスからホスト名を取得 | ネットワーク 関数 1
7 マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する | テキスト処理 1
7 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 1
2024/11/23 1:02 更新