相関係数

統計

概要

 閲覧数:2020  投稿日:2014-05-14  更新日:2014-05-14  

相関係数


コード

 function corrcoef($var_x, $var_y)

    {

        $mean_x = NULL;
        $mean_y = NULL;
        $sum_sq_x = NULL;
        $sum_sq_y = NULL;
        $sum_coproduct = NULL;

        if (!count($var_x) || !is_array($var_x))    die('配列じゃない・・・');

        if (!count($var_y) || !is_array($var_y))    die('配列じゃない・・・');

        

        $c = (count($var_x) > count($var_y)) ? count($var_x) : count($var_y);

        

        $c = 0;

        while (true) {

//Notice: Undefined offsetとなるので変更
//          if (is_null($var_x[$c]) || is_null($var_y[$c]))    break;
            if (!isset($var_x[$c]) || !isset($var_y[$c]))    break;
            $_var_x[] = $var_x[$c];

            $_var_y[] = $var_y[$c];

            $c++;

        }

        
				if ( isset( $_var_x[$c] ) ){
        	$mean_x = (float) $_var_x[$c];
				}

				if ( isset( $_var_y[$c] ) ){
        	$mean_y = (float) $_var_y[$c];
				}        

        $n = 0;

        

        while ($n < $c) {

            if (is_null($_var_x[$n]) || is_null($_var_y[$n]))    break;

            $n = (float) $n;

            $sweep = $n / ($n + 1.0);

            

            $float_x = (float) $_var_x[$n];

            $float_y = (float) $_var_y[$n];

            

            $delta_x = $float_x - $mean_x;

            $delta_y = $float_y - $mean_y;

            

            $sum_sq_x += $delta_x * $delta_x * $sweep;

            $sum_sq_y += $delta_y * $delta_y * $sweep;

            $sum_coproduct += $delta_x * $delta_y * $sweep;

            $mean_x += $delta_x / ($n + 1.0);

            $mean_y += $delta_y / ($n + 1.0);

            $n += 1;

        }

        $n = (float) $n;

        $pop_sd_x = sqrt($sum_sq_x / $n);

        $pop_sd_y = sqrt($sum_sq_y / $n);

        $cov_x_y = $sum_coproduct / $n;

        $result = $cov_x_y / ($pop_sd_x * $pop_sd_y);

        

        return $result;

    }



for ($i=0; $i<=100; $i++) {

    $ary1[] = rand(0, 100);

    $ary2[] = rand(0, 100);

}

print corrcoef($ary1, $ary2);



結果

0.12244969945723



タグ


sqrt 





PHPでExcelの統計関数を実装



週間人気ページランキング / 11-17 → 11-23
順位 ページタイトル抜粋 アクセス数
1 配列キー内に「指定文字列が含まれるキー」と「その値」を抽出して、新しい配列を返す | 配列(型) 19
2 指定文字列より前を取得 | 文字列(テキスト処理) 9
3 「指定文字」から「指定文字」までの文字列を削除 | マルチバイト文字列(テキスト処理) 7
4 URLから、トップページ(index.html)判定 | ルーティング 6
5 PHPで最後の「指定区切り文字」より後ろを取得 | 配列(型) 4
6 2.4 アイテムを推薦する | 2章(集合知プログラミング) 3
6 指定文字が2回目に出現する位置以降の文字列を取得 | 文字列(テキスト処理) 3
6 平均値、分散、標準偏差を求める | 統計 3
6 文字列に含まれるすべての半角空白と全角空白を削除 | テキスト処理 3
6 特定のHTMLタグのみ表示を許可 | エスケープ処理 3
6 null代入とunset()の違い | 変数 3
6 switch文判定 … 「in_array」「array_keys」 | 配列(型) 3
7 配列の内容(ひらがな)を、読み(あ行~わ行)で分け、新たな配列へ格納 | 配列(型) 2
7 配列要素を、文字列連結して表示 … 「array_map」×「無名関数」 | 配列(型) 2
7 多次元配列で「二次元目の最大値 +1 」 を返す | 配列(型) 2
7 24時間以降の時刻を表示 / "02:30" → "26:30" | 日付および時刻関連 2
7 static | タグ毎エントリー一覧 2
7 後ろから3文字削除 / 「18:00:00」→「18:00」 | 文字列(テキスト処理) 2
7 変数名の一部だけを可変にする | 可変変数(変数) 2
7 MySQLのdatetime型カラムに格納している値と比較して、24時間以内かどうかを判定 | 日付および時刻関連 2
2025/11/24 1:02 更新