Я установил python-nltk на Ubuntu Server 12.04, используя apt-get.
Но когда я пытаюсь загрузить корпус, я получаю следующую ошибку:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
Я пропустил какую-то конфигурацию или дополнительный пакет?
wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install
. Но проблема была поднята в github.com/nltk/nltk/issues/747Ответы:
DEFAULT_URL
Используется вdownloader.py
Убунту упаковывают версии до сих пор использует:Но текущий сервер данных:
Конечно, вы можете установить из исходного кода или ... изменить уже установленную версию, чтобы она указала на новый сервер следующим образом:
Затем вы можете установить «коричневый» корпус:
источник
Это можно исправить без изменения исходного кода. Создайте собственный загрузчик в python:
затем вы открываете диалоговое окно с графическим интерфейсом:
Убедитесь, что у вас есть права на запись в каталог загрузки и загрузите то, что вам нужно.
источник
Этот обновляет nltk, а затем
nltk.download()
снова работает.источник