Предварительное исследование приложения Python Crawler на платформе FMZ Просмотр контента объявления Binance
Недавно я увидел, что в сообществе и библиотеке нет соответствующей информации о сканерах Python, основываясь на духе всесторонней разработки QUANT, я просто выучил некоторые концепции и знания, связанные с сканерами. После некоторого понимания я обнаружил, что pit технологии crawler довольно велика. Эта статья предназначена только для предварительного изучения crawler technology. Сделайте самую простую практику на платформе FMZ Quant Trading о технологии сканера.
Спрос
Для тех, кто любит подписываться на новые акции, они всегда надеются получить информацию о валюте на бирже в первый раз. Очевидно, нереально для людей постоянно контролировать сайт биржи. Затем вам нужно использовать скрипт сканера для мониторинга страницы объявления обмена и обнаружения новых объявлений, чтобы вы могли быть уведомлены и напомнили в первый раз.
Предварительное исследование
Для начала используется очень простая программа (по-настоящему мощный скрипт сканера намного сложнее, поэтому сначала не торопитесь). Логика программы очень проста. Она позволяет программе постоянно получать доступ к странице объявлений биржи, анализировать полученный HTML-контент и обнаруживать, обновляется ли конкретное содержание ярлыка.
Код применения
Однако, учитывая, что требования очень просты, вы можете написать их непосредственно.
Следующие библиотеки python должны использоваться:
```Bs4```, which can be simply understood as a library used to parse HTML code on web pages.
Code:
из bs4 импорт BeautifulSoup
запросы на импорт
urlBinanceAnnouncement = https://www.binancezh.io/en/support/announcement/c-48?navId=48”# Адрес страницы объявления Binance
def openUrl ((url):
заголовки = {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/63.0.3239.108 Safari/537.36}
r = requests.get(url, headers=headers) # Используйте библиотеку запросов для доступа к url, т.е. адресу страницы объявления Binance
если r.status_code == 200:
r.coding = utf-8
# Запись успеха!
return r.text # Возвращение текста содержимого страницы, если доступ успешен
другие:
Регистрация не удалась.
def main (():
preNews_href =
lastNews =
В журнале (#FF0000)
пока True:
Рет = открытоеУрл ((urlBinanceОбъявление)
если ret:
soup = BeautifulSoup ((ret, html.parser) # Рассматривать веб-текст в объекты
Последние новостиhref = soup.find ((a, класс)=css-1ej4hfo) [href] # Найдите конкретный тег, получите href
lastNews = soup.find(a, class_=css-1ej4hfo).get_text() # Получить содержание в этом теге
if preNews_href == :
preNews_href = lastNews_href
if preNews_href!= lastNews_href: # Новое объявление генерируется при обнаружении изменения ярлыка
Журнал ((Новое обновление списка криптовалют!) # Напечатать сообщение
preNews_href = lastNews_href
LogStatus ((_D(), \n, preNews_href:, preNews_href, \n, news:, lastNews)
Сон ((1000 * 10)
`
Операция
Проанализировать новую валюту в объявлении и автоматически разместить заказ на подписку новых акций.