Я выполняю алгоритм Pregel с помощью Spark GraphX в Scala.
Мой граф содержит 1 миллион узлов и 5 миллионов ребер между ними. Мой кластер очень мощный, с несколькими серверами для BigData, по 256 ГБ памяти каждый.
У меня возникла ошибка "Ошибка пространства кучи Java" на этапе перемешивания во время выполнения, после более чем 20 минут обработки: задача потеряна.. Я собираюсь проанализировать эти параметры:
- Анализ того, как я загружаю график и его постоянство (StorageLevel)
- Анализ памяти, используемой: узлами, ребрами и отправленными сообщениями
- Анализ параметров, установленных в Spark при использовании команды spark-submit: количество исполнителей, память/виртуальные ядра на исполнителя, сериализация...