Cuando utilice Python para capturar contenido web, debe iniciar sesión en el sitio web; de lo contrario, no se capturará. ¿Cómo capturar una página web usando el inicio de sesión de Python?
Simplemente envíe /PLogin.do"
intente:
#Obtener instancia de cookieJar
cj = cookielib.CookieJar()< / p>
#Obtener la instancia del abridor con cookieJar como parámetro
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
# Disfrazarse de un navegador normal para evitar el acceso algunos servidores de red lo niegan
opener.addheaders = [('User-agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]
# Utilice el nombre de usuario y la contraseña de inicio de sesión para generar datos de publicación
data = urllib.urlencode({"email": usuario, "contraseña": contraseña})
#Acceso al inicio de sesión en el formulario de publicaciones, cookieJar personalizará las cookies que se guardarán después de acceder
opener.open(login_page, data)
#Usar cookies para acceder a la página
op=opener.open(url)
#Utiliza cookies para acceder a la página