Exploração preliminar da aplicação Python Crawler na plataforma FMZ Exploração do conteúdo do Anúncio da Binance
Recentemente, vi que não há informações relevantes sobre os rastreadores Python na comunidade e biblioteca, com base no espírito de desenvolvimento integral do QUANT, aprendi alguns conceitos e conhecimentos relacionados aos rastreadores simplesmente. Após algum entendimento, descobri que o pit da tecnologia crawler é bastante grande. Este artigo é apenas para o estudo preliminar da tecnologia crawler. Faça a prática mais simples na plataforma FMZ Quant Trading sobre a tecnologia do rastreador.
Demandas
Para aqueles que gostam de subscrever novas ações, eles sempre esperam obter as informações de moeda na casa de câmbio na primeira vez. É obviamente irrealista para as pessoas monitorarem o site da casa de câmbio o tempo todo.
Exploração preliminar
Um programa muito simples é usado para começar (um script de rastreador realmente poderoso é muito mais complexo, então leve seu tempo primeiro). A lógica do programa é muito simples. Ele permite que o programa acesse a página de anúncios da troca constantemente, analise o conteúdo HTML obtido e detecte se o conteúdo do rótulo específico é atualizado.
Código de execução
No entanto, considerando que os requisitos são muito simples, você pode escrever diretamente.
As seguintes bibliotecas Python devem ser utilizadas:
```Bs4```, which can be simply understood as a library used to parse HTML code on web pages.
Code:
Importação do BeautifulSoup
Pedidos de importação
UrlBinanceAnnouncement = https://www.binancezh.io/en/support/announcement/c-48?navId=48”# Endereço da página de anúncio da Binance
def openUrl ((url):
headers = {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/63.0.3239.108 Safari/537.36}
r = requests.get(url, headers=headers) # Use a biblioteca de solicitações para acessar o url, ou seja, o endereço da página de anúncios da Binance
se r.status_code == 200:
r.coding = utf-8
# Registro de sucesso!
retornar r.text # Retornar o texto do conteúdo da página se o acesso for bem sucedido
Outros:
Registo falhou.
def main (():
PreNews_href =
lastNews =
Registo (observação... urlBinanceAnúncio, #FF0000)
enquanto True:
Ret = openUrl ((urlBinanceAnúncio)
se ret:
soup = BeautifulSoup ((ret, html.parser) # Parse texto da web em objetos
Últimas Notíciashref = soup.find ((a, classe=css-1ej4hfo) [href] # Encontre uma etiqueta específica, obtenha href
lastNews = soup.find(a, class_=css-1ej4hfo).get_text() # Obter o conteúdo nesta tag
se preNews_href == :
preNews_href = lastNews_href
se preNews_href!= lastNews_href: # Um novo anúncio é gerado quando uma mudança de rótulo é detectada
Registo ((Nova atualização de listagem de criptomoedas!) # Imprima a mensagem de aviso
preNews_href = lastNews_href
LogStatus(_D(), \n, preNews_href:, preNews_href, \n, news:, lastNews)
Dormir ((1000 * 10)
`
Operação
Pode ser estendido, por exemplo, quando um novo anúncio é detectado. Analisar a nova moeda no anúncio e colocar uma ordem automaticamente para subscrever novas ações.