Какие у вас исследования? Что вы сами попробовали?
Kamil Maciorowski
Я нашел способ вернуть наиболее часто встречающиеся слова с помощью: sort test.txt | uniq -c | сортировать -rn | head -n 12 или: sort test.txt | uniq -c | сортировать -rn | голова -n 12 | sed -E 's / ^ * [0-9] + // g'
что вы имеете в виду, когда говорите: вы будете устанавливать свои собственные записи FileList и Count.?
Shani Gamrian
Это может быть быстрее с uniq -c (дальнейшая логика должна быть перестроена, конечно).
Kamil Maciorowski
@ShaniGamrian - FileList имя файла, содержащего слова; Count это количество записей, которые вы хотите проверить. Я думал, что это будет очевидно: извините, если это не было ясно для вас.
AFH
@KamilMaciorowski - Спасибо за ваше предложение: я забыл о uniq -c и это намного проще и быстрее. Я добавил это в свой ответ.
Ответы:
Это делает основы, хотя это будет довольно медленно в большом списке слов:
Более быстрый ответ (спасибо Камилю Мачоровски): -
Это предполагает: -
FileList
а такжеCount
записей.WordList
,The
а такжеthe
разные).set Count
будет опущен и передан в качестве параметра.Это должно помочь вам начать работу, хотя вам почти наверняка понадобится внести изменения в соответствии с вашими потребностями.
источник
uniq -c
(дальнейшая логика должна быть перестроена, конечно).FileList
имя файла, содержащего слова;Count
это количество записей, которые вы хотите проверить. Я думал, что это будет очевидно: извините, если это не было ясно для вас.uniq -c
и это намного проще и быстрее. Я добавил это в свой ответ.