Вопросы по теме 'spark-dataframe'

Использование spark sql DataFrameWriter для создания внешней таблицы Hive
В рамках процесса интеграции данных, над которым я работаю, мне необходимо сохранить Spark SQL DataFrame в качестве внешней таблицы Hive. Мои ограничения на данный момент: В настоящее время ограничено Spark 1.6 (v1.6.0) Необходимо сохранить...
2551 просмотров

Кеш Spark 1.6 Dataframe работает некорректно
Я понимаю, что если у меня есть фрейм данных, если я кэширую его () и запускаю действие, подобное df.take(1) или df.count (), он должен вычислять фрейм данных и сохранять его в памяти, и всякий раз, когда этот кешированный фрейм данных вызывается в...
2248 просмотров