সম্প্রতি, আমি আমাদের ফোরাম এবং ডাইজেস্টের মাধ্যমে দেখেছি, এবং পাইথন ক্রলার সম্পর্কে কোনও প্রাসঙ্গিক তথ্য নেই। ব্যাপক বিকাশের এফএমজেডের মানসিকতার ভিত্তিতে, আমি কেবল ক্রলারের ধারণাগুলি এবং জ্ঞান সম্পর্কে শিখতে গিয়েছিলাম। এটি সম্পর্কে জানার পরে, আমি দেখতে পেলাম যে
আইপিও ট্রেডিং পছন্দ করে এমন ব্যবসায়ীদের জন্য, তারা সর্বদা যত তাড়াতাড়ি সম্ভব প্ল্যাটফর্মের তালিকাভুক্ত তথ্য পেতে চায়। অবশ্যই, প্ল্যাটফর্মের ওয়েবসাইটে সর্বদা ম্যানুয়ালি নজর রাখা অবাস্তব। তারপরে আপনাকে প্ল্যাটফর্মের ঘোষণাপত্রের পৃষ্ঠাটি পর্যবেক্ষণ করতে ক্রলার স্ক্রিপ্ট ব্যবহার করতে হবে এবং প্রথমবারের মতো বিজ্ঞপ্তি এবং স্মরণ করিয়ে দেওয়ার জন্য নতুন ঘোষণাগুলি সনাক্ত করতে হবে।
শুরুতে একটি খুব সহজ প্রোগ্রাম ব্যবহার করুন (সত্যিই শক্তিশালী ক্রলার স্ক্রিপ্টগুলি অনেক বেশি জটিল, তাই আপনার সময় নিন) । প্রোগ্রাম লজিকটি খুব সহজ, অর্থাৎ, প্রোগ্রামটিকে একটি প্ল্যাটফর্মের ঘোষণার পৃষ্ঠাটি অবিচ্ছিন্নভাবে পরিদর্শন করতে দিন, অর্জিত HTML সামগ্রী বিশ্লেষণ করুন এবং নির্দিষ্ট লেবেলের সামগ্রী আপডেট হয়েছে কিনা তা সনাক্ত করুন।
আপনি কিছু দরকারী ক্রলার কাঠামো ব্যবহার করতে পারেন। যেহেতু চাহিদা খুব সহজ, আপনি সরাসরি লিখতে পারেন।
ব্যবহৃত পাইথন লাইব্রেরিঃrequests
, যা কেবল ওয়েব পেজ অ্যাক্সেস করার জন্য ব্যবহৃত লাইব্রেরি হিসাবে বিবেচনা করা যেতে পারে।bs4
, যা কেবলমাত্র ওয়েব পৃষ্ঠাগুলির HTML কোড বিশ্লেষণের জন্য ব্যবহৃত লাইব্রেরি হিসাবে বিবেচিত হতে পারে।
কোডঃ
from bs4 import BeautifulSoup
import requests
urlBinanceAnnouncement = "https://www.binancezh.io/en/support/announcement/c-48?navId=48" # Binance announcement web page address
def openUrl(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36'}
r = requests.get(url, headers=headers) # use "requests" library to access url, namely the Binance announcement web page address
if r.status_code == 200:
r.encoding = 'utf-8'
# Log("success! {}".format(url))
return r.text # if the access succeeds, return the text of the page content
else:
Log("failed {}".format(url))
def main():
preNews_href = ""
lastNews = ""
Log("watching...", urlBinanceAnnouncement, "#FF0000")
while True:
ret = openUrl(urlBinanceAnnouncement)
if ret:
soup = BeautifulSoup(ret, 'html.parser') # parse the page text into objects
lastNews_href = soup.find('a', class_='css-1ej4hfo')["href"] # find specified lables, to obtain href
lastNews = soup.find('a', class_='css-1ej4hfo').get_text() # obtain the content in the label
if preNews_href == "":
preNews_href = lastNews_href
if preNews_href != lastNews_href: # the label change detected, namely the new announcement generated
Log("New Cryptocurrency Listing update!") # print the prompt message
preNews_href = lastNews_href
LogStatus(_D(), "\n", "preNews_href:", preNews_href, "\n", "news:", lastNews)
Sleep(1000 * 10)
আপনি এটিকে আরও বাড়িয়ে তুলতে পারেন, যেমন নতুন ঘোষণা সনাক্তকরণ, নতুন তালিকাভুক্ত মুদ্রা প্রতীক বিশ্লেষণ এবং আইপিও ট্রেডের স্বয়ংক্রিয় অর্ডার।