文字列を「複数の区切り文字」で配列へ変換 / preg_split使用案。採用

テキスト処理文字列

 閲覧数:1091  投稿日:2020-06-22  更新日:2020-06-22  

文字列を「区切り文字(。か.)」で配列へ変換

preg_split
u (PCRE_UTF8)
パターンと対象文字列は、 UTF-8 として処理されます。
https://www.php.net/manual/ja/reference.pcre.pattern.modifiers.php



コード

$str = '正規表現は必ずしも遅いとは限りません。
Regular expressions are not always slow.
速度を計測してみた方が良いかもしれません。
It may be better to measure the speed.';
$strAry = preg_split('/[."。"]/u',$str); //u指定理由は、日本語文字化け対策
$strAry = array_diff($strAry, ['']); //空要素削除
var_dump($strAry);



結果

array(4) {
  [0]=>
  string(54) "正規表現は必ずしも遅いとは限りません"
  [1]=>
  string(41) "
Regular expressions are not always slow"
  [2]=>
  string(62) "
速度を計測してみた方が良いかもしれません"
  [3]=>
  string(39) "
It may be better to measure the speed"
}



タグ


preg_split 





文字列を「複数の区切り文字」で配列へ変換 / explode使用案。却下



類似度ページランキング
順位 ページタイトル抜粋
1 文字列を「複数の区切り文字」で配列へ変換 / preg_split使用案。採用 85
2 文字列を「複数の区切り文字」で配列へ変換 / explode使用案。却下 69
3 対象文字列へ対して、一致したすべての文字列を置換する標準関数 / str_replace 41
4 「可変変数」 × 「配列要素を、文字列連結して表示」 … for文+implode 38
5 ctype_digit / 数字だけを許可 36
6 配列の空要素を削除(コールバック関数未使用) … array_filter() 36
7 「{ }」も「.」も使用せず、文字列の中で変数を展開する 36
8 配列の要素を別々の変数に代入する list() 35
9 「input type="datetime-local"」で受け取った文字列をハイフンへ変更 35
10 配列の空要素を削除(コールバック関数利用) … array_filter() 34
11 array_count_values / 配列の要素が持つ値の出現回数をカウント 33
12 配列の要素を置換して結果を配列で返す array_replace() 33
13 ctype_alnum / 英数字だけを許可 33
14 投稿日時をTwitterのように「 33
15 「Fatal error」のみを表示させるuser定義関数 32
16 PHPで最後の「指定区切り文字」より後ろを取得 32
17 array_diffを使用して、「複数配列」間で「存在している値」を比較後、その結果を配列で返す 32
18 配列要素を、文字列連結して表示 … 「array_map」×「無名関数」 32
19 range関数 / 引数が「numeric string」→ 「int で構成された配列」を返す → ctype_digit「FALSE」 31
20 「range(int または numeric string または string)で生成した複数配列」をマージした結果の型を確認 31
2025/2/06 3:01 更新
週間人気ページランキング / 1-30 → 2-5
順位 ページタイトル抜粋 アクセス数
1 URLから、トップページ(index.html)判定 | ルーティング 11
2 24時間以降の時刻を表示 / "02:30" → "26:30" | 日付および時刻関連 5
3 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 4
3 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 4
3 8桁の生年月日数字を分解 | 文字列(テキスト処理) 4
3 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 現在WebページのURLパスを第2階層まで取得 | パス 3
4 「指定文字」直後から「指定文字」直前までの文字列を返す | マルチバイト文字列(テキスト処理) 3
4 null代入とunset()の違い | 変数 3
4 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 3
5 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 2
5 日付表示(フォーマット指定) | 日付および時刻関連 2
5 foreach内で一度「true」判定された後、次回以降「false」にする仕組みがないと、foreachの度に「true」「false」判定することができない | 条件分岐 2
5 配列の空要素を削除 / array_diff()で空配列と比較し配列の差分を返す | 配列(型) 2
5 多次元配列で「二次元目の最大値 +1 」 を返す | 配列(型) 2
5 指定文字列より前を取得 | 文字列(テキスト処理) 2
5 foreachの中でswitch文 | 配列(型) 2
6 指定配列キーの重複数をカウント | 配列(型) 1
6 Smartyのテンプレートにincludeしたファイルを表示 | Smarty(テンプレートエンジン) 1
6 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 1
2025/2/6 1:02 更新