Словарь текстового файла [закрыто]

222

Я пишу программу, которая требует много слов английского языка. Я пытаюсь найти файл словаря, в котором много слов. Кто-нибудь знает хороший источник? Я перепробовал много источников, но, похоже, их нет.

Суперструнисты
источник
3
@ Право Я не удалил его, я закрыл его, потому что он не соответствует текущим ожиданиям переполнения стека. Он явно просит рекомендации, ссылки на которые не по теме.
Тарын
Правда, я забыл, что On Hold переходит в Closed, а не удаляется.
DWright
Итак, @bluefeet, извините за мой «протестующий» комментарий, который был дезинформирован, ваше действие правильное и не вычитает ценность.
DWright
15
Зачем извиняться? Очевидно, что это имеет значение для SO сообщества. «Текущие ожидания» SO явно не соответствуют действительности.
Андрей

Ответы:

224

Как насчет /usr/share/dict/wordsлюбой системы Unix? Сколько слов мы говорим? Как OED-Unabridged?

Роберт
источник
20
Спасибо ! 200000+ слов, высоко ценится! cat /usr/share/dict/words > words.txtвсе вещи !
Jokoon
7
Если вам не хватает этого файла, вы можете установить его в Debian / Ubuntu, набравsudo apt-get install wbritish
airstrike
17
Кто-нибудь случайно знает место, где его можно скачать для не-Unix систем?
Том
2
@ Tom Да, www.FreeBSD.org (установите FreeBSD где-нибудь и бум, у вас есть). В остальном я думаю, что этот список похож: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Грег Шмит
2
В случае , если вы не знаете: Это будет работать на MacOS тоже :)
Льюис
44

Для файла .txt английского словаря вы можете использовать пользовательский словарь .

Вы также можете создать список aspell или wordlist с собственными настройками.

Также вы можете взглянуть на http://wordlist.sourceforge.net/

Только английские слова: http://www.math.sjsu.edu/~foster/dictionary.txt

Суджит PS
источник
Хотя эта ссылка может ответить на вопрос, лучше включить сюда основные части ответа и предоставить ссылку для справки. Ответы, содержащие только ссылки, могут стать недействительными, если связанная страница изменится.
DeanOC
21
@DeanOC: Я думаю, что довольно просто, что «существенными частями» словаря будет весь словарь. Это не практично вставлять здесь. Также довольно ясно, что использование: выхватить слова из этого. Так что на самом деле это не только ссылка. Это законный рекомендационный ответ на вопрос, который должен быть (и сейчас) закрыт.
Натан Тагги
@NathanTuggy Этот ответ появился в очереди LQP, и я считаю, что он соответствует определению ответа только по ссылке. Как пользователь с репутацией <3K, мой голос за удаление ничего не делает, кроме как помогает привлечь к нему внимание того, кто может.
DeanOC
1
@DeanOC: я знаю, что это появилось в LQP. Я нажимаю «выглядит хорошо» по указанным причинам: в основном, «только ссылка» гораздо более тонко, чем «имеет ссылку, но нет кода или цитаты? BURN WITH FIRE». Следует отметить , что достаточно Рекомендуют выбор удаления, даже 2k пользователи будут удалять сообщения. (Лично я отвечал за то, что опрокинул ряд постов.)
Натан Тагги,
@NathanTuggy Вы можете свободно голосовать по своему усмотрению. Я проголосовал за удаление, так как не вижу значения в этом ответе, если ссылка устарела.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350 000 слов

Очень поздно, но может быть полезно для других.

Раджендра Уппал
источник
24
Глядя на первые несколько, многие не являются обычными английскими словами.
tripleee
8
это было бесполезно, так как в нем отсутствовали многие простые слова, такие как грех, в ...
FernandoZ
7
Да, и есть такие слова, как "wwwwwww". Ни слова.
Джаред Форсайт
1
Осторожно, эта ссылка приводит к сбою моего Firefox, потому что он пытается загрузить весь файл ahahahaha
Эндрю
@ Эндрю не падает в Chrome 50.
Богдан М.
11

Там также WordNet . Его формат файлов данных хорошо документирован.
Я использовал его для создания встраиваемой библиотеки словарей для разработчиков iOS ( www.lexicontext.com ), а также в одном из моих приложений.

Ori
источник
2
Джекпот. Если кто-то ищет слова, сопоставленные с их частями речи, просто загрузите основной пакет WordNet.
Андрей
10

@ Future-Searchers: вы можете использовать aspell для проверки словаря, он имеет привязки в ruby ​​и python. Это сделало бы вашу работу намного проще.

Хаджа Минхаджуддин
источник