かわぐちです。
> しかし今度はファイル自体の存在が認識されないのか下記のようなエラーが出てしまいます。
> ERROR security.UserGroupInformation: PriviledgedActionException as:root (auth:SIMPLE) cause:java.io.IOException: Input not found (datasource=s3,basePath="s3/example/input", resourcePattern="sample.csv")
Direct I/Oの設定が正しいとして、考えられそうなのが
EMR外のHadoop環境からS3に対するアクセスとのことなので、
S3のファイルシステムの設定を s3:// ではなく s3n:// を使うべきかもしれません。
EMRとApache Hadoopなどで s3:// と s3n:// では
S3ファイルシステムの指定に対する挙動が異なるので
もしs3://というS3ブロックファイルシステムを使うことが
意図的でないならば設定を確認したほうがいいかもしれません。
詳細は以下が参考になると思います。
なお、もしS3ネイティブファイルシステムのほうを使うのであれば、
core-site.xml などHadoop側の設定の変更と、
asakusa-resources.xmlの設定の両方が必要です。
( ファイルシステムのPrefixやプロパティキーの一部を s3 から s3n に変更する )
ご利用の環境が本件の内容に関係するかわかりませんが、
まずはご参考まで。
2013年7月1日月曜日 19時22分00秒 UTC+9 神谷実花: