Python - RSS-Feed lesen

RSS (Rich Site Summary) ist ein Format für die Bereitstellung regelmäßig wechselnder Webinhalte. Viele Nachrichten-Websites, Weblogs und andere Online-Publisher syndizieren ihre Inhalte als RSS-Feed für alle, die dies wünschen. In Python verwenden wir das folgende Paket, um diese Feeds zu lesen und zu verarbeiten.

pip install feedparser

Vorschubstruktur

Im folgenden Beispiel erhalten wir die Struktur des Feeds, damit wir weiter analysieren können, welche Teile des Feeds wir verarbeiten möchten.

import feedparser
NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms")
entry = NewsFeed.entries[1]
print entry.keys()

Wenn wir das obige Programm ausführen, erhalten wir die folgende Ausgabe:

['summary_detail', 'published_parsed', 'links', 'title', 'summary', 'guidislink', 'title_detail', 'link', 'published', 'id']

Feed-Titel und Beiträge

Im folgenden Beispiel lesen wir den Titel und den Kopf des RSS-Feeds.

import feedparser
NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms")
print 'Number of RSS posts :', len(NewsFeed.entries)
entry = NewsFeed.entries[1]
print 'Post Title :',entry.title

Wenn wir das obige Programm ausführen, erhalten wir die folgende Ausgabe -

Number of RSS posts : 5
Post Title : Cong-JD(S) in SC over choice of pro tem speaker

Feed-Details

Basierend auf der obigen Eingabestruktur können wir die erforderlichen Details aus dem Feed mithilfe des Python-Programms ableiten, wie unten gezeigt. Da der Eintrag ein Wörterbuch ist, verwenden wir seine Schlüssel, um die benötigten Werte zu erzeugen.

import feedparser
NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms")
entry = NewsFeed.entries[1]
print entry.published
print "******"
print entry.summary
print "------News Link--------"
print entry.link

Wenn wir das obige Programm ausführen, erhalten wir die folgende Ausgabe -

Fri, 18 May 2018 20:13:13 GMT
******
Controversy erupted on Friday over the appointment of BJP MLA K G Bopaiah as pro tem speaker for the assembly, with Congress and JD(S) claiming the move went against convention that the post should go to the most senior member of the House. The combine approached the SC to challenge the appointment. Hearing is scheduled for 10:30 am today.
------News Link--------
https://timesofindia.indiatimes.com/india/congress-jds-in-sc-over-bjp-mla-made-pro-tem-speaker-hearing-at-1030-am/articleshow/64228740.cms