Я все еще новичок в Hadoop, и на этот раз я пытался обработать файл размером 106 ГБ. Раньше я -copyFromLocal
копировал этот большой файл в мою Hadoop DFS, но так как файл большой, мне приходится долго ждать, не зная о текущем статусе копирования.
Есть ли способ показать текущее состояние копирования файла с помощью этой команды?
Заранее спасибо, ребята, за помощь!
Также можно отслеживать ход чтения локального файла с помощью
pv
команды и передавать содержимое файла вhdfs dfs
stdin:pv mylargefile.txt | hdfs dfs -put - /path/to/file/on/hdfs/mylargefile.txt
источник
pv
такой недооцененный инструмент ИМО. Делает работу здесь отлично.Не похоже, что есть какая-либо подробная опция для любой из команд копирования (copyFromLocal, copyToLocal, get, put). Лучше всего, вероятно, посмотреть на размер файла в месте его назначения в HDFS, чтобы оценить его прогресс.
источник
Вы можете использовать «nohup &» для выполнения копирования в качестве фонового процесса. nohup заставит процесс выполняться даже после выхода из сервера. Когда вам нужно, вы можете проверить процесс, используя "hadoop fs -ls.
источник