Основная проблема аутентификации Python urllib2

81

Обновление: на основе комментария Ли я решил сжать свой код до действительно простого скрипта и запустить его из командной строки:

import urllib2
import sys

username = sys.argv[1]
password = sys.argv[2]
url = sys.argv[3]
print("calling %s with %s:%s\n" % (url, username, password))

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, url, username, password)
urllib2.install_opener(urllib2.build_opener(urllib2.HTTPBasicAuthHandler(passman)))

req = urllib2.Request(url)
f = urllib2.urlopen(req)
data = f.read()
print(data)

К сожалению, он по-прежнему не генерирует Authorizationзаголовок (для Wireshark) :(

У меня проблема с отправкой базового AUTH по urllib2. Я просмотрел эту статью и последовал примеру. Мой код:

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, "api.foursquare.com", username, password)
urllib2.install_opener(urllib2.build_opener(urllib2.HTTPBasicAuthHandler(passman)))

req = urllib2.Request("http://api.foursquare.com/v1/user")    
f = urllib2.urlopen(req)
data = f.read()

Я вижу следующее на Wire через wirehark:

GET /v1/user HTTP/1.1
Host: api.foursquare.com
Connection: close
Accept-Encoding: gzip
User-Agent: Python-urllib/2.5 

Вы можете видеть, что авторизация не отправляется, а когда я отправляю запрос через curl: curl -u user:password http://api.foursquare.com/v1/user

GET /v1/user HTTP/1.1
Authorization: Basic =SNIP=
User-Agent: curl/7.19.4 (universal-apple-darwin10.0) libcurl/7.19.4 OpenSSL/0.9.8k zlib/1.2.3
Host: api.foursquare.com
Accept: */*

По какой-то причине мой код не отправляет аутентификацию - кто-нибудь видит, что мне не хватает?

благодаря

-симон

Саймон
источник
1
Интересно, проблема в том, что сайт не возвращает 'WWW-Authenticate'заголовок. Вы можете проверить это, используя try: urllib2.urlopen(req) except urllib2.HTTPError, e: print e.headers этот ответ на сообщение SO .
Марк Микофски

Ответы:

199

Проблема может заключаться в том, что библиотеки Python в соответствии со стандартом HTTP сначала отправляют неаутентифицированный запрос, а затем, только если на него ответили повторной попыткой 401, отправляются правильные учетные данные. Если серверы Foursquare не выполняют «полностью стандартную аутентификацию», библиотеки работать не будут.

Попробуйте использовать заголовки для аутентификации:

import urllib2, base64

request = urllib2.Request("http://api.foursquare.com/v1/user")
base64string = base64.b64encode('%s:%s' % (username, password))
request.add_header("Authorization", "Basic %s" % base64string)   
result = urllib2.urlopen(request)

Была та же проблема, что и вы, и нашла решение в этой теме: http://forums.shopify.com/categories/9/posts/27662

yayitswei
источник
Ошибка HTTP 505: Версия HTTP не поддерживается; (
Дэниел Магнуссон,
Также работает с аутентификацией PayPal (для получения access_token). Большое спасибо, дружище!
DerShodan
3
Обратите внимание, что вы можете просто вызвать base64.b64encodeвместо, base64.encodestringи тогда вам не нужно заменять новую строку.
Trey Stout
Спасибо @TreyStout, я отредактировал решение, чтобы включить ваше предложение.
yayitswei
Аналогичная проблема здесь .. В браузере загружено содержимое авторизованной страницы, и если я нажму кнопку отмены, я могу увидеть содержимое страницы с паролем
Мостафа
5

(копирование-вставка / адаптировано из https://stackoverflow.com/a/24048772/1733117 ).

Сначала вы можете создать подкласс urllib2.BaseHandlerили urllib2.HTTPBasicAuthHandler, и реализовать http_requestтак, чтобы каждый запрос имел соответствующий Authorizationзаголовок.

import urllib2
import base64

class PreemptiveBasicAuthHandler(urllib2.HTTPBasicAuthHandler):
    '''Preemptive basic auth.

    Instead of waiting for a 403 to then retry with the credentials,
    send the credentials if the url is handled by the password manager.
    Note: please use realm=None when calling add_password.'''
    def http_request(self, req):
        url = req.get_full_url()
        realm = None
        # this is very similar to the code from retry_http_basic_auth()
        # but returns a request object.
        user, pw = self.passwd.find_user_password(realm, url)
        if pw:
            raw = "%s:%s" % (user, pw)
            auth = 'Basic %s' % base64.b64encode(raw).strip()
            req.add_unredirected_header(self.auth_header, auth)
        return req

    https_request = http_request

Тогда если вы ленивы, как я, установите обработчик глобально

api_url = "http://api.foursquare.com/"
api_username = "johndoe"
api_password = "some-cryptic-value"

auth_handler = PreemptiveBasicAuthHandler()
auth_handler.add_password(
    realm=None, # default realm.
    uri=api_url,
    user=api_username,
    passwd=api_password)
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
днозай
источник
5

Вот что я использую для решения аналогичной проблемы, с которой я столкнулся при попытке доступа к API MailChimp. Это то же самое, только лучше отформатировано.

import urllib2
import base64

chimpConfig = {
    "headers" : {
    "Content-Type": "application/json",
    "Authorization": "Basic " + base64.encodestring("hayden:MYSECRETAPIKEY").replace('\n', '')
    },
    "url": 'https://us12.api.mailchimp.com/3.0/'}

#perform authentication
datas = None
request = urllib2.Request(chimpConfig["url"], datas, chimpConfig["headers"])
result = urllib2.urlopen(request)
Хайден Шелтон
источник
4

Второй параметр должен быть URI, а не доменным именем. т.е.

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, "http://api.foursquare.com/", username, password)
Ли
источник
1
Спасибо - я хотел бы упомянуть , я попробовал , что в ряде различных комбинаций http://api.foursquare.com, api.foursquare.com, http://api.foursquare.com/v1/, но это не похоже , чтобы решить эту проблему.
Саймон
Я просто попробовал это на локальном сервере, который требует базовой аутентификации, и с URL-адресом в add_password он работал нормально. Поэтому я бы предположил, что здесь происходит что-то еще.
Ли
Это будет работать только в том случае, если HTTP-ответ содержит код 401 Unauthorized и заголовок 'WWW-Authenticate'; см. этот ответ на сообщение SO .
Марк Микофски,
0

Я бы предположил, что текущее решение - использовать мой пакет urllib2_prior_auth, который решает эту проблему довольно хорошо (я работаю над включением в стандартный lib.

mcepl
источник
Будет ли разрешено открывать URL-адреса вродеurllib2.urlopen('http://USER:PASS@example.com/path/')
ddofborg
Это еще одна проблема. Вы уверены, что это не работает со стандартом urllib2?
mcepl