PHPでExcelの統計関数を実装

統計

概要

 閲覧数:1396  投稿日:2014-05-07  更新日:2014-05-07  

PHPでExcelの統計関数を実装

関数名一覧
s_average
・単純平均を取得

s_harmean
・調和平均を取得

s_varp
・分散を取得
(引数を母集団全体であると仮定して、母集団の分散を返す)

s_stdevp
・標準偏差を取得

s_devp
・偏差値を取得

s_correl
・相関係数を取得

s_intercept
・回帰直線のy切片を求める
([y = a * x + b]の[b]を求める)

s_slope
・回帰直線の傾きを求める
([y = a * x + b]の[a]を求める)

s_forecast
・回帰直線上でxに対応するyを求める


コード

/**
 * 単純平均を取得する
 */
function s_average($list) {
		$sum = NULL;
    if(count($list) < 2 || !is_array($list)){
        return false;
    }
    $count = count($list);
    for ($i = 0; $i < $count; $i++) {
        $sum += $list[$i];
    }
    return $sum / $count;
}
/**
 * 調和平均を取得する
 */
function s_harmean($list) {
		$sum = NULL;
    if(count($list) < 2 || !is_array($list)){
        return false;
    }
    $count = count($list);
    for ($i = 0; $i < $count; $i++) {
        $sum += 1 / $list[$i];
    }
    return $count / $sum;
}
/**
 * 分散を取得する
 * (引数を母集団全体であると仮定して、母集団の分散を返す)
 */
function s_varp($list) {
    if(count($list) < 2 || !is_array($list)){
        return false;
    }
    $avg = s_average($list);
    $dec = 0;
    $count = count($list);
    for($i = 0; $i < $count; $i++){
        $dec += pow($avg - $list[$i], 2);
    }
    return $dec / $count;
}
/**
 * 標準偏差を取得する
 */
function s_stdevp($list) {
    if(count($list) < 2 || !is_array($list)){
        return false;
    }
    return sqrt(s_varp($list));
}
/**
 * 偏差値を取得する
 */
function s_devp($list, $val) {
    if(count($list) < 2 || !is_array($list)){
        return false;
    }
    return 10 * ($val - s_average($list)) / s_stdevp($list) + 50;
}
/**
 * 相関係数を取得する
 */
function s_correl($list_y, $list_x){
    if(count($list_x) < 2 || count($list_y) < 2 || count($list_x) != count($list_y)){
        return false;
    }
    $avg_x = s_average($list_x);
    $stdevp_x = s_stdevp($list_x);
    $avg_y = s_average($list_y);
    $stdevp_y = s_stdevp($list_y);
    
    $count = count($list_x);
    for($i = 0; $i < $count; $i++){
        $x = $list_x[$i] - $avg_x;
        $y = $list_y[$i] - $avg_y;
        $devsum[$i] = $x * $y;
    }
    
    $avg_devsum = s_average($devsum);
    return $avg_devsum / ($stdevp_x * $stdevp_y);
}
/**
 * 回帰直線のy切片を求める
 * ([y = a * x + b]の[b]を求める)
 */
function s_intercept($list_y, $list_x){
		$x_sum = NULL;
		$y_sum = NULL;
		$xx_sum = NULL;
		$xy_sum = NULL;
    if(count($list_x) < 2 || count($list_y) < 2 || count($list_x) != count($list_y)){
        return false;
    }
    $count = count($list_x);
    for ($i = 0; $i < $count; $i++) {
        $x = $list_x[$i];
        $y = $list_y[$i];
        $x_sum += $x;
        $y_sum += $y;
        $xx_sum += $x * $x;
        $xy_sum += $x * $y;
    }
    $a = ($count * $xy_sum - $x_sum * $y_sum)/($count * $xx_sum - $x_sum * $x_sum);
    $b = ($y_sum - $a * $x_sum)/$count;
    
    return $b;
}
/**
 * 回帰直線の傾きを求める
 * ([y = a * x + b]の[a]を求める)
 */
function s_slope($list_y, $list_x){
		$x_sum = NULL;
		$y_sum = NULL;
		$xx_sum = NULL;
		$xy_sum = NULL;
    if(count($list_x) < 2 || count($list_y) < 2 || count($list_x) != count($list_y)){
        return false;
    }
    $count = count($list_x);
    for ($i = 0; $i < $count; $i++) {
        $x = $list_x[$i];
        $y = $list_y[$i];
        $x_sum += $x;
        $y_sum += $y;
        $xx_sum += $x * $x;
        $xy_sum += $x * $y;
    }
    $a = ($count * $xy_sum - $x_sum * $y_sum)/($count * $xx_sum - $x_sum * $x_sum);
    $b = ($y_sum - $a * $x_sum)/$count;
    
    return $a;
}
/**
 * 回帰直線上でxに対応するyを求める
 */
function s_forecast($target_x, $list_y, $list_x){
    if(count($list_x) < 2 || count($list_y) < 2 || count($list_x) != count($list_y)){
        return false;
    }
    $a = s_slope($list_y, $list_x);
    $b = s_intercept($list_y, $list_x);
    
    return $a * $target_x + $b;
}
/**
 * 回帰直線上の上昇率を求める
 */
function s_rate($list_y, $list_x){
    if(count($list_x) < 2 || count($list_y) < 2 || count($list_x) != count($list_y)){
        return false;
    }
    $a = s_slope($list_y, $list_x);
    $b = s_intercept($list_y, $list_x);
    
    return ($a * $list_x[count($list_x) - 1] + $b) / ($a * $list_x[count($list_x) - 2] + $b);
}

$data = array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);

$target = 47;

for ($i=0; $i<=100; $i++) {
    $ary1[] = rand(0, 100);
    $ary2[] = rand(0, 100);
}

echo "単純平均: ".s_average($data)."\n";
echo "調和平均: ".s_harmean($data)."\n";
echo "分散: ".s_varp($data)."\n";
echo "標準偏差: ".s_stdevp($data)."\n";
echo "偏差値: ".s_devp($data,$target)."\n";
echo "相関係数: ".s_correl($ary2,$ary1)."\n";
echo "回帰直線のy切片: ".s_intercept($ary2,$ary1)."\n";
echo "回帰直線の傾き: ".s_slope($ary2,$ary1)."\n";
echo "回帰直線上でxに対応するy: ".s_forecast($target,$ary2,$ary1)."\n";
echo "回帰直線上の上昇率: ".s_rate($ary2,$ary1)."\n";



結果

単純平均: 5.5
調和平均: 3.4141715214741
分散: 8.25
標準偏差: 2.872281323269
偏差値: 194.48445444323
相関係数: 0.043400299696919
回帰直線のy切片: 49.860824372578
回帰直線の傾き: 0.044513636792814
回帰直線上でxに対応するy: 51.95296530184
回帰直線上の上昇率: 1.0077046568278



タグ


is_array 





平均値、分散、標準偏差、学力偏差値を求める

相関係数



週間人気ページランキング / 11-16 → 11-22
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 8
1 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 8
2 URLから、トップページ(index.html)判定 | ルーティング 6
3 指定文字列より前を取得 | 文字列(テキスト処理) 5
4 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 4
4 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 4
5 現在WebページのURLパスを第2階層まで取得 | パス 3
5 対象文字列の内、「最初の指定文字列以前」と「それ以降の文字列」を取得する | 文字列(テキスト処理) 3
5 2 つの配列(文字列とdatetime)が要素順で 対応している時、日付を整形して 新しい配列を作成 | 配列(型) 3
6 再帰処理で平坦な連想配列をツリー化 | 多次元配列(型) 2
6 「1週間後の年月日時分秒」を表示 … time() | 日付および時刻関連 2
6 投稿日時をTwitterのように「★分前」「★時間前」という文字列変換するユーザ定義PHP関数 | 日付および時刻関連 2
6 配列要素を、文字列連結して表示(元配列を上書) … foreach文+implode | 配列(型) 2
6 8桁の生年月日数字から、年齢を計算 | 日付および時刻関連 2
6 null代入とunset()の違い | 変数 2
6 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 2
7 配列定数同士をarray_mergeで後ろに単純連結(キーは新たに振り直す) | 定数 1
7 gethostbyaddr / IPアドレスからホスト名を取得 | ネットワーク 関数 1
7 マークダウンで書かれたURLを(エスケープ処理するのではなく)削除する | テキスト処理 1
7 対象文字列を、文字数に応じて半分に分割後、それぞれを取得 | 文字列(テキスト処理) 1
2024/11/23 1:02 更新