列表 第页
我已经实现了在蜂巢的任务。目前,它正在罚款我的单节点集群。现在,我计划在AWS上部署它。I have implemented a task in Hive. Currently it is working fine on my single node cluster.Now I am planning to de...阅读全文
我开发的尝试读取存储在S3雄鹿日志文件,并使用弹力麻preduce解析它的应用程序。当前的日志文件的格式如下I am developing an application that try to read log file stored in S3 bucks and parse it using Elastic Ma...阅读全文
我已经运行在AWS上的电子病历工作,并存储在电子病历工作的HDFS输出。我然后试图通过DistCp使用或s3distcp结果复制到S3,但两者是失败,如下所述。 (注:原因我不只是送我的电子病历工作的直接输出到S3是由于(目前未解决)问题我描述Where是我的AWS EMR减速机的输出为我完成的工作(应该是在S3上,但...阅读全文
我使用的是亚马逊的电子病历。我在S3一些日志数据,都在同一个桶,但在不同的子目录这样的:S3://bucketname/2014/08/01/abc/file1.bzS3://bucketname/2014/08/01/abc/file2.bzS3://bucketname/2014/08/01/xyz/fil...阅读全文
我得到一个错误没有剩余空间的设备时,我使用m1.large作为实例类型必须由jobflow创建Hadoop的实例上运行我的亚马逊电子病历工作。这项工作产生约。 10 GB的在最大和由于m1.large实例的容量数据的应该是420GB * 2(根据: EC2实例类型的)。我很困惑10GB的数据怎么只是可能导致磁盘空间已满...阅读全文