Exploración preliminar de la aplicación Python Crawler en la plataforma FMZ Exploración del contenido del anuncio de Binance
Recientemente, vi que no hay información relevante sobre los rastreadores de Python en la comunidad y la biblioteca, basándome en el espíritu de desarrollo integral de QUANT, aprendí algunos conceptos y conocimientos relacionados con los rastreadores simplemente. Después de un poco de comprensión, encontré que el pit de tecnología de rastreadores es bastante grande. Este artículo es solo para el estudio preliminar de tecnología de rastreadores. Haga la práctica más simple en la plataforma de comercio de FMZ Quant sobre la tecnología de rastreadores.
Demandas
Para aquellos que les gusta suscribir nuevas acciones, siempre esperan obtener la información de la moneda en el intercambio la primera vez. Obviamente no es realista que la gente monitoree el sitio web del intercambio todo el tiempo. Luego debe usar el script de rastreo para monitorear la página de anuncio del intercambio y detectar nuevos anuncios para que pueda ser notificado y recordado la primera vez.
Exploración preliminar
Un programa muy simple se utiliza para comenzar (un script de rastreador realmente poderoso es mucho más complejo, así que tómate tu tiempo primero). La lógica del programa es muy simple. Permite al programa acceder a la página de anuncios del intercambio constantemente, analizar el contenido HTML obtenido y detectar si el contenido de la etiqueta específica se actualiza.
Código de aplicación
Puede utilizar algunos frameworks de rastreo útiles. Sin embargo, considerando que los requisitos son muy simples, puede escribirlos directamente.
Se deben utilizar las siguientes bibliotecas de Python:
```Bs4```, which can be simply understood as a library used to parse HTML code on web pages.
Code:
Desde bs4 importar BeautifulSoup
solicitudes de importación
urlBinanceAnuncio = https://www.binancezh.io/en/support/announcement/c-48?navId=48”# La dirección de la página de anuncios de Binance
Def openUrl ((url)):
cabeceras = {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/63.0.3239.108 Safari/537.36}
r = requests.get(url, headers=headers) # Utilice la biblioteca de peticiones para acceder a la url, es decir, la dirección de la página de anuncios de Binance
si el código r.status_code == 200:
r.codificación = utf-8
# Registro de éxito!
devolver r.text # Devolver el contenido de la página si el acceso es exitoso
en otros casos:
Log (( fallido {}.format ((url))
Definición principal:
PreNews_href =
Las últimas noticias =
Registro (¡¡Vigilar..., urlBinanceAnuncio, #FF0000)
mientras True:
Ret = openUrl ((urlBinanceAnuncio)
si se encuentra:
sup = BeautifulSoup ((ret, html.parser) # Parse el texto web en objetos
Las últimas noticiashref = sopa.find, claseEncuentra una etiqueta específica, consigue href
lastNews = soup.find(a, class_=css-1ej4hfo).get_text() # Obtener el contenido en esta etiqueta
si preNews_href == :
PreNews_href = última Noticias_href
si preNews_href!= lastNews_href: # Se genera un nuevo anuncio cuando se detecta un cambio de etiqueta
Registro ((Nueva actualización de la lista de criptomonedas!) # Imprima el mensaje de aviso
PreNews_href = última Noticias_href
LogStatus ((_D(), \n, preNews_href:, preNews_href, \n, news:, lastNews)
El sueño (1000 * 10)
`
Operación
Se puede extender, por ejemplo, cuando se detecta un nuevo anuncio.