Вопросы по теме 'google-cloud-dataproc'

Pyspark Group: слишком медленный счет
Я запускаю pyspark в кластере dataproc с 4 узлами, каждый из которых имеет 2 ядра и 8 ГБ ОЗУ. У меня есть фреймворк со столбцом, содержащим список слов. Я взорвал этот столбец и подсчитал количество повторов, используя -...
471 просмотров