У меня есть матрица данных, которая содержит два столбца: значение, частота.
Я хочу сделать блок-диаграмму значений, взвешенных по столбцу частоты. Матрица отсортирована по значению.
> data[1:5,]
value freq
1 28 1184
2 29 1063
3 30 1000
4 31 976
5 32 944
Я прочитал много ответов о подобных проблемах, единственное решение, которое я нашел, это это. http://r.789695.n4.nabble.com/boxplot-with-frequencies-counts-td4660330.html
counts<-matrix(rep(data$value,data$freq), ncol=1, byrow=TRUE)
boxplot(counts)
Проблема с построением матрицы, повторяющей каждое значение, заключается в том, что получается невероятно большая матрица. В то время как R смог сделать это в своей памяти, я работаю над R на виртуальной машине (Ubuntu), и мне интересно, может ли быть альтернативный подход для действительно больших наборов данных. Возможно, есть библиотека, созданная для этой цели?