Считает линейную корреляцию между наборами данных
corr-calc [DATA_FILE] [-o|--output OUTPUT_FILE]
DATA_FILE
-- файл входных данных. По умолчанию "data.csv"OUTPUT_FILE
файл результатов. По умолчанию "results.csv"
CSV-файл. Каждый набор данных представляет собой строку следующего вида:
%код набора%, %название набора%, %числа через запятую%
Наборы могут быть с разным количеством чисел. При подсчёте между двумя наборами более длинный обрезается.
0, Набор 1, 1.0, 2.5, 3, 4
1, Набор 2, 1,2,3
2, Набор 3, 0,9,8,7,6,5,4
corr-calc
рассчитывает корреляции по следующему правилу:
Рассчитать корреляцию между "Набор 1" и "Набор 2" если код "Набор 1" меньше чем код "Набор 2"
Допустим у вас есть 5 наборов данных и вы хотите подсчитать корреляцию между
- набором 1 и наборами 3 и 4
- набором 2 и наборами 3 и 4
- набором 3 и набором 4
- набором 5 и наборами 1,2,3,4
Получается следующий CSV-файл:
1, Набор 1, ...
1, Набор 2, ...
2, Набор 3, ...
3, Набор 4, ...
0, Набор 5, ...