Red de conocimientos turísticos - Conocimientos sobre calendario chino - Cuando utilice Python para capturar contenido web, debe iniciar sesión en el sitio web; de lo contrario, no se capturará. ¿Cómo capturar una página web usando el inicio de sesión de Python?

Cuando utilice Python para capturar contenido web, debe iniciar sesión en el sitio web; de lo contrario, no se capturará. ¿Cómo capturar una página web usando el inicio de sesión de Python?

Algunas páginas web requieren que inicie sesión antes de poder acceder a ellas y debe proporcionar su cuenta y contraseña.

Simplemente envíe /PLogin.do"

intente:

#Obtener instancia de cookieJar

cj = cookielib.CookieJar()< / p>

#Obtener la instancia del abridor con cookieJar como parámetro

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

# Disfrazarse de un navegador normal para evitar el acceso algunos servidores de red lo niegan

opener.addheaders = [('User-agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]

# Utilice el nombre de usuario y la contraseña de inicio de sesión para generar datos de publicación

data = urllib.urlencode({"email": usuario, "contraseña": contraseña})

#Acceso al inicio de sesión en el formulario de publicaciones, cookieJar personalizará las cookies que se guardarán después de acceder

opener.open(login_page, data)

#Usar cookies para acceder a la página

op=opener.open(url)

#Utiliza cookies para acceder a la página

ipt>