【まえおき】
現在のFMEでは、UTF-8 Shapefile を読み込んだとき、属性名中の日本語文字が文字化けします。
また、属性名に日本語文字が含まれるデータをFMEによって UTF-8 Shapefile で出力したとき、ArcGIS 等で開いたときに、属性名中の日本語文字が文字化けします。
この件について以前、Safe社に確認したところ、Shapefileの属性ファイルとして使用されているdBASEフォーマットの本来の仕様では、フィールド名はシステムのエンコーディングで記述することになっており、FMEはそれに従い、エンコーディングの設定いかんに関わらず属性名はシステムのエンコーディング(日本語版WindowsならShift_JIS)で処理するとのことでした。
しかし、現実には、ArcGISをはじめとして Shapefile を使用するアプリケーションでは、属性名も含めて指定されたエンコーディングで記述されていることを前提としているようです。
そのため、Safe社には、Shapefileを使用するアプリケーションの仕様にあわせて、属性名も指定したエンコーディングで読み書きするように改良することを要望しています。
現時点では、属性名に日本語文字が含まれる場合には、Shift_JIS のみのサポートとなります(Windowsの場合)。
以上、「まえおき」ですが、UTF-8 Shapefile から Shift_JIS の Shapefile に変換できた(問題ない)ということは、属性名には日本語文字が含まれていないのですね。
文字化け後の文字も、文字コード(数値)としては UTF-8、Shift_JIS のどちらでも妥当な値なので、Passed ポートに出力されるのだと思います。
少し試してみましたが、ワークスペース内で、元の属性データがUTF-8、Shift_JISのどちらで作成されたか正確に判定するのは難しいかも知れません。
Pythonスクリプトの利用も含めて、もう少し考えてみますね。