文字列を「複数の区切り文字」で配列へ変換 / explode使用案。却下

テキスト処理文字列

 閲覧数:1021  投稿日:2020-06-22  更新日:2024-01-30  

文字列を「区切り文字(。か.)」で配列へ変換

preg_split使用案と、速度計測比較してみたが、ほとんど差異を感じなかった
http://phpcode.w4c.work/php/status/217


注意点
文字列最後に区切る文字があると、配列にした際、最後の要素に空文字が入る


コード

<?php
function explode2U($delimiter1, $delimiter2, $str) {
  $ary = [];
  
  //「分割文字その1」で文字列を分割
  $ary1 = explode($delimiter1, trim($str));

  //各配列を「分割文字その2」で分割して結合していく
  foreach ($ary1 as $val) {
      $ary = array_merge($ary, explode($delimiter2, trim($val)));
  }
  return $ary;
}


$str = '正規表現は必ずしも遅いとは限りません。
Regular expressions are not always slow.
速度を計測してみた方が良いかもしれません。
It may be better to measure the speed.';

$strAry = explode2U('。','.',$str);
$strAry = array_diff($strAry, ['']); //空要素削除
var_dump($strAry);



結果

array(4) {
  [0]=>
  string(54) "正規表現は必ずしも遅いとは限りません"
  [1]=>
  string(39) "Regular expressions are not always slow"
  [2]=>
  string(62) "
速度を計測してみた方が良いかもしれません"
  [3]=>
  string(37) "It may be better to measure the speed"
}



タグ


explode 





対象文字列を、文字数に応じて半分に分割後、それぞれを取得

文字列を「複数の区切り文字」で配列へ変換 / preg_split使用案。採用



類似度ページランキング
順位 ページタイトル抜粋
1 文字列を「複数の区切り文字」で配列へ変換 / explode使用案。却下 86
2 文字列を「複数の区切り文字」で配列へ変換 / preg_split使用案。採用 69
3 「可変変数」 × 「配列要素を、文字列連結して表示」 … for文+implode 39
4 「{ }」も「.」も使用せず、文字列の中で変数を展開する 38
5 「input type="datetime-local"」で受け取った文字列をハイフンへ変更 37
6 PHPで最後の「指定区切り文字」より後ろを取得 34
7 対象文字列へ対して、一致したすべての文字列を置換する標準関数 / str_replace 33
8 配列要素を、文字列連結して表示(元配列に変化なし) … foreach文+implode 30
9 複数の指定文字列を削除 30
10 マークダウンで「> 引用」を、HTMLエスケープ後、
へHTML変換
30
11 数字を3桁でカンマ区切りに 29
12 配列の要素を置換して結果を配列で返す array_replace() 29
13 array_diffを使用して、「複数配列」間で「存在している値」を比較後、その結果を配列で返す 29
14 配列要素を、文字列連結して表示(元配列を上書) … foreach文+implode 28
15 配列要素を、文字列連結して表示 … 「array_map」×「無名関数」 28
16 「Fatal error」のみを表示させるuser定義関数 28
17 ctype_alnum / 英数字だけを許可 28
18 ctype_digit / 数字だけを許可 28
19 stdClassで、指摘キー毎の数をカウント後、新たなキー「count」として追加 / foreach 28
20 文字列の中で変数展開される要件 27
2024/11/23 11:14 更新
週間人気ページランキング / 11-16 → 11-22
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 8
1 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 8
2 URLから、トップページ(index.html)判定 | ルーティング 6
3 指定文字列より前を取得 | 文字列(テキスト処理) 5
4 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 4
5 現在WebページのURLパスを第2階層まで取得 | パス 3
5 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 3
5 2 つの配列(文字列とdatetime)が要素順で 対応している時、日付を整形して 新しい配列を作成 | 配列(型) 3
6 再帰処理で平坦な連想配列をツリー化 | 多次元配列(型) 2
6 「1週間後の年月日時分秒」を表示 … time() | 日付および時刻関連 2
6 投稿日時をTwitterのように「★分前」「★時間前」という文字列変換するユーザ定義PHP関数 | 日付および時刻関連 2
6 配列要素を、文字列連結して表示(元配列を上書) … foreach文+implode | 配列(型) 2
6 8桁の生年月日数字から、年齢を計算 | 日付および時刻関連 2
6 null代入とunset()の違い | 変数 2
6 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 2
7 配列定数同士をarray_mergeで後ろに単純連結(キーは新たに振り直す) | 定数 1
7 gethostbyaddr / IPアドレスからホスト名を取得 | ネットワーク 関数 1
7 マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する | テキスト処理 1
7 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 1
2024/11/23 1:02 更新