Вопросы по теме 'emr'

Mahout на Elastic MapReduce: пространство кучи Java
Я запускаю Mahout 0.6 из командной строки в кластере Amazon Elastic MapReduce, пытаясь сгруппировать около 1500 коротких документов, и задания продолжают завершаться сбоем с сообщением «Ошибка: пространство кучи Java». Основываясь на предыдущих...
3919 просмотров
schedule 12.03.2024

Hive не может найти файл из распределенного кеша в EMR
Я пытаюсь запустить UDF в Hive, который в основном должен сканировать внешний файл csv, используя значение из таблицы в качестве другого аргумента. Я использую запрос: add jar s3://bucket_name/udf/hiveudf.jar; add FILE hdfs:///myfile/myfile.csv;...
185 просмотров
schedule 03.05.2024