हाल ही में, मैंने हमारे फोरम और डाइजेस्ट को देखा, और पायथन क्रॉलर के बारे में कोई प्रासंगिक जानकारी नहीं है। व्यापक विकास की एफएमजेड भावना के आधार पर, मैं केवल क्रॉलर की अवधारणाओं और ज्ञान के बारे में जानने के लिए गया। इसके बारे में जानने के बाद, मुझे पता चला कि अभी भी
आईपीओ ट्रेडिंग पसंद करने वाले व्यापारियों के लिए, वे हमेशा प्लेटफॉर्म लिस्टिंग की जानकारी जितनी जल्दी हो सके प्राप्त करना चाहते हैं। यह स्पष्ट रूप से हर समय एक प्लेटफॉर्म वेबसाइट पर मैन्युअल रूप से घूरना अवास्तविक है। फिर आपको प्लेटफॉर्म के घोषणा पृष्ठ की निगरानी करने के लिए क्रॉलर स्क्रिप्ट का उपयोग करने की आवश्यकता है, और पहली बार में सूचित और याद दिलाने के लिए नई घोषणाओं का पता लगाने के लिए।
प्रारंभ के रूप में एक बहुत ही सरल प्रोग्राम का उपयोग करें (वास्तव में शक्तिशाली क्रॉलर स्क्रिप्ट बहुत अधिक जटिल हैं, इसलिए अपना समय लें) । कार्यक्रम तर्क बहुत सरल है, अर्थात, प्रोग्राम को लगातार किसी प्लेटफ़ॉर्म के घोषणा पृष्ठ पर जाने दें, अधिग्रहित HTML सामग्री को पार्स करें, और पता लगाएं कि निर्दिष्ट लेबल की सामग्री अपडेट की गई है या नहीं।
आप कुछ उपयोगी क्रॉलर संरचनाओं का उपयोग कर सकते हैं। यह देखते हुए कि मांग बहुत सरल है, आप सीधे भी लिख सकते हैं।
प्रयोग करने के लिए पायथन पुस्तकालयःrequests
, जिसे केवल वेब पृष्ठों तक पहुँचने के लिए उपयोग की जाने वाली पुस्तकालय के रूप में माना जा सकता है।bs4
, जिसे वेब पृष्ठों के एचटीएमएल कोड को पार्स करने के लिए उपयोग की जाने वाली लाइब्रेरी के रूप में माना जा सकता है।
कोडः
from bs4 import BeautifulSoup
import requests
urlBinanceAnnouncement = "https://www.binancezh.io/en/support/announcement/c-48?navId=48" # Binance announcement web page address
def openUrl(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36'}
r = requests.get(url, headers=headers) # use "requests" library to access url, namely the Binance announcement web page address
if r.status_code == 200:
r.encoding = 'utf-8'
# Log("success! {}".format(url))
return r.text # if the access succeeds, return the text of the page content
else:
Log("failed {}".format(url))
def main():
preNews_href = ""
lastNews = ""
Log("watching...", urlBinanceAnnouncement, "#FF0000")
while True:
ret = openUrl(urlBinanceAnnouncement)
if ret:
soup = BeautifulSoup(ret, 'html.parser') # parse the page text into objects
lastNews_href = soup.find('a', class_='css-1ej4hfo')["href"] # find specified lables, to obtain href
lastNews = soup.find('a', class_='css-1ej4hfo').get_text() # obtain the content in the label
if preNews_href == "":
preNews_href = lastNews_href
if preNews_href != lastNews_href: # the label change detected, namely the new announcement generated
Log("New Cryptocurrency Listing update!") # print the prompt message
preNews_href = lastNews_href
LogStatus(_D(), "\n", "preNews_href:", preNews_href, "\n", "news:", lastNews)
Sleep(1000 * 10)
आप इसे विस्तार भी कर सकते हैं, जैसे कि नई घोषणा का पता लगाना, नए सूचीबद्ध मुद्रा प्रतीकों का विश्लेषण करना, और आईपीओ व्यापार का स्वचालित आदेश देना।