Khám phá sơ bộ ứng dụng Python Crawler trên nền tảng FMZ Khám phá nội dung thông báo của Binance
Gần đây, tôi đã thấy rằng không có thông tin liên quan về trình thu thập thông tin Python trong cộng đồng và thư viện, dựa trên tinh thần phát triển toàn diện của QUANT, tôi chỉ đơn giản học được một số khái niệm và kiến thức liên quan đến trình thu thập thông tin. Sau khi hiểu một chút, tôi thấy rằng pit của công nghệ crawler khá lớn. Bài viết này chỉ dành cho nghiên cứu sơ bộ về công nghệ crawler. Làm bài tập đơn giản nhất trên nền tảng FMZ Quant Trading về công nghệ trình thu thập thông tin.
Nhu cầu
Đối với những người thích đăng ký cổ phiếu mới, họ luôn hy vọng có được thông tin về tiền tệ trên sàn giao dịch lần đầu tiên. Rõ ràng là không thực tế khi mọi người theo dõi trang web sàn giao dịch mọi lúc. Sau đó bạn cần sử dụng kịch bản thu thập thông tin để theo dõi trang thông báo sàn giao dịch và phát hiện các thông báo mới để bạn có thể được thông báo và nhắc nhở lần đầu tiên.
Khám phá sơ bộ
Một chương trình rất đơn giản được sử dụng để bắt đầu (một kịch bản trình thu thập dữ liệu thực sự mạnh mẽ phức tạp hơn nhiều, vì vậy hãy dành thời gian của bạn trước).
Mã thực thi
Bạn có thể sử dụng một số khung trình thu thập dữ liệu hữu ích. Tuy nhiên, xem xét rằng các yêu cầu rất đơn giản, bạn có thể viết chúng trực tiếp.
Các thư viện python sau đây cần được sử dụng:
```Bs4```, which can be simply understood as a library used to parse HTML code on web pages.
Code:
từ bs4 nhập BeautifulSoup
Yêu cầu nhập khẩu
urlBinanceAnnouncement = https://www.binancezh.io/en/support/announcement/c-48?navId=48”Địa chỉ trang thông báo của Binance
def openUrl ((url):
tiêu đề = {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, giống như Gecko) Chrome/63.0.3239.108 Safari/537.36}
r = requests.get(url, headers=headers) # Sử dụng thư viện yêu cầu để truy cập url, tức là địa chỉ của trang thông báo Binance
if r.status_code == 200:
r.coding = utf-8
# Log ((success! {}.format ((url))
trả về r.text # Trả về nội dung trang nếu truy cập thành công
khác:
Log (đã thất bại)
defin main (():
preNews_href =
lastNews =
Log (( xem..., urlBinanceAnnouncement, #FF0000)
trong khi True:
RET = openUrl ((urlBinanceAnnouncement)
nếu ret:
soup = BeautifulSoup ((ret, html.parser) # Phân tích văn bản web thành các đối tượng
tin tức cuối cùnghref = soup.find ((a, lớp=css-1ej4hfo) [href] # Tìm một thẻ cụ thể, lấy href
lastNews = soup.find(a, class_=css-1ej4hfo).get_text() # Nhận nội dung trong thẻ này
if preNews_href == :
preNews_href = lastNews_href
if preNews_href!= lastNews_href: # Một thông báo mới được tạo ra khi một thay đổi nhãn được phát hiện
Log ((Sự cập nhật danh sách tiền điện tử mới!) # In thông báo nhanh
preNews_href = lastNews_href
LogStatus ((_D(), \n, preNews_href:, preNews_href, \n, news:, lastNews)
Giấc ngủ ((1000 * 10)
`
Hoạt động
Nó có thể được mở rộng, ví dụ, khi một thông báo mới được phát hiện. Phân tích tiền tệ mới trong thông báo, và đặt một lệnh tự động để đăng ký cổ phiếu mới.