Вопросы по теме 'emr'
Mahout на Elastic MapReduce: пространство кучи Java
Я запускаю Mahout 0.6 из командной строки в кластере Amazon Elastic MapReduce, пытаясь сгруппировать около 1500 коротких документов, и задания продолжают завершаться сбоем с сообщением «Ошибка: пространство кучи Java».
Основываясь на предыдущих...
3919 просмотров
schedule
12.03.2024
Hive не может найти файл из распределенного кеша в EMR
Я пытаюсь запустить UDF в Hive, который в основном должен сканировать внешний файл csv, используя значение из таблицы в качестве другого аргумента. Я использую запрос:
add jar s3://bucket_name/udf/hiveudf.jar;
add FILE hdfs:///myfile/myfile.csv;...
185 просмотров
schedule
03.05.2024