Sorting and merging multiple files

Sorting and merging multiple files

디렉토리 구조는 요렇다.

각 part-r-* 파일들은 아래처럼 Word(string) \t Reference(decimal) \n 인 엔트리들을 가지고 있는데 모든 part-r-*들을 모아서 Reference에 따라 descending order로 정렬하고 싶다.

 

스크립트는

 

Leave a Reply