स्पेस रेस डेटासेट का ईडीए
आइए आपको मानव जाति के "रॉकेट लॉन्च" प्रयासों से परिचित कराते हैं। आइए जानें कि "कैसे" हम वास्तव में "रॉकेट लॉन्च" की अविश्वसनीय रूप से जटिल कला का प्रयास करते हैं, हम इन पिल्लों को कहां से लॉन्च करना पसंद करते हैं, यह "हम"
कौन है, और यह वास्तव में कितना है सभी लागत?
1.0 दावेदार
जानकारी का पहला विस्फोट। वर्डक्लाउड परिदृश्य खींचता है और कंपनियों को जितनी कुशलता से प्राप्त करता है उतनी ही कुशलता से प्रस्तुत करता है।
हालाँकि इसमें गहराई की भावना की कमी होती है, इसलिए हम एक अधिक पारंपरिक ग्राफ पर भी नज़र डालेंगे, जो मिश्रण में कुछ ठोस संख्याओं को जोड़ने की अनुमति देगा।
from wordcloud import WordCloud
company_counts = df['Company Name'].value_counts()
company_dict = company_counts.to_dict()
wordcloud = WordCloud(width=800, height=400, background_color='white', colormap='viridis').generate_from_frequencies(company_dict)
plt.figure(figsize=(16, 6))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
plt.figure(figsize=(16,6))
sns.countplot(data=df, x="Company Name", order=df["Company Name"].value_counts().index)
plt.xticks(rotation=90)
plt.ylabel("Cummulative Missions")
plt.show()
एक सफल मून लैंडिंग मिशन के लिए रूसी लगातार अपनी भूख का पीछा कर रहे हैं। लेकिन.. क्या वाकई यह पूरी कहानी है?
1.1 मिशन के प्रयासों की समयरेखा
def extract_year(datum):
parts = datum.split(" ")
year = parts[3].strip()
year = int(year)
return year
df['Year'] = df['Datum'].apply(extract_year)
plt.figure(figsize=(7,11))
sns.scatterplot(data=df, y="Company Name", x="Year", hue="Status Mission")
plt.show()
- RVSN USSR ने बहुत पहले रॉकेट लॉन्च करना बंद कर दिया था। आइए मिश्रण में वार्षिक प्रयासों की तीव्रता जोड़कर गहराई का विस्तार करें
cumulative_entries = df.groupby(['Year', 'Company Name']).cumcount() + 1
df_cumulative = df[['Year', 'Company Name']].copy()
df_cumulative['Cumulative Entries'] = cumulative_entries
plt.figure(figsize=(7, 11))
sns.scatterplot(data=df, y="Company Name", x="Year", hue="Status Mission", size=df_cumulative['Cumulative Entries'], size_norm=None)
handles, labels = plt.gca().get_legend_handles_labels()
plt.title('Space Missions by Company and Year')
plt.show()
नए रॉकेट लॉन्च गेम के दावेदारों से आने वाले प्रयास की तीव्रता उपरोक्त लाइनप्लॉट पर अच्छी तरह से देखी गई है।
1.2 "कहां"
आइए उन लॉन्च साइटों और देशों पर एक नज़र डालें जो अक्सर लॉन्च हो रहे थे।
इस विज़ुअलाइज़ेशन के लिए, केवल 10+ लॉन्च वाले देशों को ही ध्यान में रखा जाता है।
country_missions = df.groupby('Country').size().reset_index(name='Total Missions')
filtered_countries = country_missions[country_missions['Total Missions'] > 10]['Country']
filtered_df = df[df['Country'].isin(filtered_countries)]
yearly_missions = filtered_df.groupby(['Year', 'Country']).size().reset_index(name='Missions')
yearly_missions['Cumulative Missions'] = yearly_missions.groupby('Country')['Missions'].cumsum()
fig, ax = plt.subplots(figsize=(13, 7.6))
sns.lineplot(x='Year', y='Cumulative Missions', hue='Country', style='Country', data=yearly_missions)
plt.title('Countries and their utilization as a Launch Location')
plt.show()
परिप्रेक्ष्य भी नीचे पाया जाता है।
colors = ['#f7fbff', '#deebf7', '#c6dbef', '#9ecae1', '#6baed6', '#4292c6', '#2171b5', '#08519c', '#08306b']
cmap = ListedColormap(colors)
worldmap = gpd.read_file(gpd.datasets.get_path("naturalearth_lowres"))
country_missions.loc[country_missions['Country'] == 'USA', 'Country'] = 'United States of America'
worldmap['Country'] = worldmap['name']
merged_worldmap = worldmap.merge(country_missions, on='Country', how='left')
fig, ax = plt.subplots(figsize=(12, 6))
merged_worldmap.plot(column='Total Missions', cmap=cmap, linewidth=0.8, edgecolor='0.8', legend=True, ax=ax, legend_kwds={'label': "Total Missions"}, missing_kwds={'color': "white"})
ax.set_title('Countries and their utilization as a Launch Location')
ax.set_xlabel('Longitude')
ax.set_ylabel('Latitude')
plt.show()
मिशन कितनी बार सफल होता है? क्या ये सुरक्षित है?
कुंआ..
launch_counts = df.groupby(['Year', 'Status Mission']).size().reset_index(name='Count')
pivot_counts = launch_counts.pivot(index='Year', columns='Status Mission', values='Count').fillna(0)
sns.set_style('whitegrid')
plt.figure(figsize=(14, 5.6))
sns.barplot(x=pivot_counts.index, y=pivot_counts['Success'], color='g', label='Success')
sns.barplot(x=pivot_counts.index, y=pivot_counts['Failure'], bottom=pivot_counts['Success'], color='r', label='Failure')
plt.xlabel('Year')
plt.ylabel('Number of Launches')
plt.title('Number of Successful vs. "Failure" Launches Each Year')
plt.xticks(rotation=45)
plt.legend()
plt.show()
Companies and their track record | 4 row subplotted barplot
उपरोक्त सफलता के वितरण को देखते हुए, कृपया ध्यान दें कि अमेरिकी नौसेना ने बहुत शुरुआत (1950) में केवल रॉकेट लॉन्च करने का प्रयास किया था। इस भाग को पूरा करने के बाद, आइए लागत $ पर एक नज़र डालें।
1.4 लागत
def millions_formatter(x):
return f"{round(x * 1e-3):,.0f}B$"
grouped_data = df.groupby('Company Name')[' Rocket'].sum().reset_index()
fig.update_layout(title='Distribution of Rocket Costs by Company')
fig.show()
from matplotlib.ticker import FuncFormatter
grouped_data = df.groupby('Year')[' Rocket'].sum().reset_index()
grouped_data[' Rocket'] = grouped_data[' Rocket'] / 1000
plt.figure(figsize=(12, 8))
sns.barplot(x='Year', y=' Rocket', data=grouped_data, color="b")
plt.xticks(rotation=45)
plt.xlabel('Year')
plt.ylabel('Expenditure in USD')
plt.title('Sum of Documented* expenses per Year')
def billions_formatter(x, pos):
return f"{x * 1000000000 :,.0f}$"
ax = plt.gca()
ax.yaxis.set_major_formatter(FuncFormatter(billions_formatter))
plt.show()
अरबों अमेरिकी डॉलर खर्च करना एक बड़ा निवेश लग सकता है।
हालांकि यह कुछ भी नहीं है, जब अकेले 2021 में अनुमानित 1.42 ट्रिलियन अमेरिकी डॉलर के फार्मा बाजार के साथ तुलना की जाती है (माना जाता है - कुछ मामलों में फरा को "पैसा प्रिंट करने" के लिए जाना जाता है)। इसके अलावा, ऑटोमोटिव निर्माण उद्योग ने 2021 में लगभग 2.86 ट्रिलियन अमेरिकी डॉलर का राजस्व अर्जित किया।
1.5 स्रोत डेटा
nextspaceflight.com
लिफ्ट बंद! पढ़ने के लिए धन्यवाद।
# U S E D L I B R A R I E S
import pandas as pd
import geopandas as gpd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
from wordcloud import WordCloud
import plotly.graph_objects as go