Можно ли вместо копирования в HDFS просто получить массив объектов в корзине S3 для обработки в EMR?
Я пробовал это, и я продолжаю либо получать предупреждения безопасности об отсутствии учетных данных (даже после того, как я добавляю их в конфиги) (это из-за того, что я просто делаю новый путь ("s3n://...")) или запускаю jar говорит мне, что мне не хватает SDK AWS, когда я пытаюсь использовать SDK AWS для доступа к своей корзине.
ruby elastic-mapreduce --jobflow <id> --jar s3://<jar-location>/myJob.jar --arg s3://<input-path> --arg s3://<output-path> --step-name "My Job"
- person Amar   schedule 14.08.2013s3://<access-key>:<secret-key>@<input-path>
, что-то вродеs3://RYWX12N9WCY42XVOL8WH:Xqj1%2FNMvKBhl1jqKlzbYJS66ua0e8z7Kkvptl9bv@mybucket/dest
- person Amar   schedule 24.08.2013