FileInputFormatで無視されるPath
多段のMapReduceを書く際に、_SUCCESS などのディレクトリは読み取られずには、次のFileInputFormatから無視されるけど、FileInputFormatは、どんな条件でフィルタをかけているんだろう?と思い確認してみました。
private static final PathFilter hiddenFileFilter = new PathFilter(){ public boolean accept(Path p){ String name = p.getName(); return !name.startsWith("_") && !name.startsWith("."); } };
"."および"_"から始まるPathは無視されるんですね。