PHÂN TÍCH Sa thải CÔNG TY
Tôi đã thử phân tích dữ liệu bằng Microsoft Excel và tôi đã tìm thấy một bộ dữ liệu về sa thải trên Kaggle. Lúc đầu, tôi không nghĩ nó thú vị, nhưng dù sao thì tôi cũng quyết định biến nó thành dự án của mình.
Chỉ muốn gửi lời cảm ơn nhanh đến Biliqees Abolomope - blog của cô ấy thực sự đã truyền cảm hứng cho tôi viết bài này! Nếu bạn quan tâm, thỉnh thoảng hãy xem nội dung của cô ấy trên Phương tiện.
GIỚI THIỆU VỀ BỘ SỐ LIỆU
Tập dữ liệu là một tệp CSV được lấy từ Bộ dữ liệu Kaggle @ Layoffs | Kaggle và bao gồm việc sa thải nhân viên trong các ngành khác nhau từ COVID-19 đến nay.
Bộ dữ liệu bao gồm 9 cột:
- công ty (tên công ty)
- địa điểm (địa điểm sa thải)
- ngành (ngành của công ty)
- tổng số người bị sa thải (số lượng nhân viên bị sa thải)
- tỷ lệ bị sa thải (tỷ lệ nhân viên bị sa thải)
- ngày (ngày sa thải)
- giai đoạn (giai đoạn tài trợ)
- quốc gia
- quỹ gây quỹ (quỹ được huy động bởi công ty)
Điều quan trọng là phải làm sạch dữ liệu trước khi phân tích vì dữ liệu có thể chứa các mục nhập không mong muốn, điều này có thể gây ra lỗi trong quá trình phân tích của bạn.
Vì vậy, khi tôi bắt đầu dọn dẹp dữ liệu, tôi quyết định thay đổi mọi thứ một chút và chuyển đổi cột phần trăm sa thải từ số thập phân sang, bạn đoán xem, định dạng phần trăm.
Để xử lý các con số và có được 'tổng số nhân viên trước khi sa thải xảy ra', tôi tiếp tục và thêm vào một cột mới. Ồ, và tôi đã đảm bảo thêm một câu lệnh IF để loại bỏ bất kỳ ô trống phiền phức nào và biến chúng thành các số 0 đẹp, gọn gàng trước khi tôi làm tròn mọi thứ.
- Ở đây, tôi nhận thấy rằng có một số ô trong cả hai cột (Tổng số đã đặt hàng và Tỷ lệ phần trăm đã đặt hàng) và điều này gây ra lỗi khi tìm các giá trị cột Tổng số nhân viên.
Calculate the Total Staff
=FLOOR(IF(OR(ISBLANK(E2) = FALSE, ISBLANK(F2) = FALSE),IFERROR(E2/F2,E2), 0), 1)
Inserting the “Total Staff” column using the above formula
Tôi đã trích xuất năm và tháng từ cột ngày.
For Year column
=YEAR(H2)
For Month column
=TEXT(H2, "MMM")
Cuối cùng, tôi đã xóa tất cả các giá trị trùng lặp khỏi tập dữ liệu.
Tiếp theo, tôi lấy tập dữ liệu và làm cho nó trông bắt mắt bằng cách chuyển đổi nó thành định dạng bảng. Sau đó, để làm cho cuộc sống trở nên dễ dàng hơn, tôi đã sử dụng bảng đó để tạo ra một bảng tổng hợp ngọt ngào cung cấp cho tôi tất cả thông tin tóm tắt hấp dẫn mà tôi cần.
PHÂN TÍCH DỮ LIỆU
Tôi đã tiến hành phân tích tập dữ liệu sau khi chuyển đổi bảng của mình thành bảng tổng hợp và tôi có thể đưa ra câu trả lời cho một số câu hỏi sau:
- Tổng số sa thải cho đến nay
- sa thải theo tháng
- Những công ty sa thải nhân viên
- Công ty gây quỹ cao nhất
- Giai đoạn gây quỹ và sa thải cao nhất
- Ngành gây quỹ cao nhất
Điều này được thể hiện dưới dạng "Tổng số sa thải theo năm" trên bảng điều khiển
Lần sa thải cao nhất xảy ra vào năm 2023 và lần sa thải ít nhất là vào năm 2021.
Bây giờ, tôi tạo biểu đồ hình tròn/bánh rán để thể hiện điều này theo cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Xóa huyền thoại
- Thêm nhãn dữ liệu bằng tùy chọn 'chú thích dữ liệu'.
- Thay đổi tên tiêu đề
Biểu đồ điều chỉnh của chúng tôi trông như thế này:
Các công ty đã sa thải nhân viên của họ (bởi công ty):
Điều này được thể hiện dưới dạng “ Sa thải bởi công ty ” trên bảng điều khiển.
Khi mọi thứ đã được thiết lập xong, tôi sàng lọc bảng tổng hợp như một chuyên gia và thu hẹp nó xuống chỉ còn '5 công ty hàng đầu' đã dốc toàn lực cho việc sa thải nhân viên.
Process to filter Top % Company
Right-click on company name --> Filter --> Top 10
Top 5 Company
5 công ty hàng đầu có số lần sa thải nhiều nhất từ năm 2020 đến năm 2023 là Amazon, Meta, Google, Philips và Microsoft.
Bây giờ, tôi tạo một biểu đồ thanh để thể hiện điều này một cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Xóa chú thích và đường lưới
- Thay đổi tên tiêu đề “Sa thải theo công ty”
- Thay đổi màu của biểu đồ
- Thêm nhãn dữ liệu vào các thanh và điều chỉnh chúng (bấm vào trục cột, sau đó nhấp vào tùy chọn trục, sau đó nhấp vào số, sau đó mã định dạng và nhập 0,00, ”K ” để điều chỉnh).
- Điều chỉnh trục ngang (bấm vào trục cột, sau đó nhấp vào tùy chọn trục, sau đó nhấp vào số, sau đó chọn mã định dạng và nhập 0,” K ” để điều chỉnh).
Điều này được thể hiện dưới dạng " Gây quỹ bởi Công ty " trên bảng điều khiển.
Một lần nữa, Sau khi đã thiết lập xong, tôi sàng lọc bảng tổng hợp như một người chuyên nghiệp và thu hẹp nó xuống chỉ còn '5 công ty hàng đầu' đã dốc toàn lực vào việc gây quỹ.
5 công ty được tài trợ nhiều nhất từ năm 2020 đến năm 2023 là Netflix, Vedantu, Domestika, Meta và Twitter.
Bây giờ, tôi tạo một biểu đồ thanh để thể hiện điều này một cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Xóa chú thích và đường lưới
- Thay đổi tên tiêu đề
- Thay đổi màu biểu đồ và tiêu đề
- Thêm nhãn dữ liệu vào các thanh và điều chỉnh chúng (bấm vào trục cột, sau đó nhấp vào tùy chọn trục, sau đó nhấp vào số, sau đó mã định dạng và nhập 0,0, ”M ” để điều chỉnh).
- Điều chỉnh trục dọc (bấm vào trục cột, sau đó nhấp vào tùy chọn trục, sau đó nhấp vào số, sau đó mã định dạng và nhập 0,” M ” để điều chỉnh trục tung).
Điều này được thể hiện dưới dạng “ Quỹ huy động và sa thải ” trên bảng điều khiển.
Hãy lọc bảng tổng hợp này với sự kết hợp của người gây quỹ cao nhất với số lần sa thải của họ.
5 giai đoạn hàng đầu gây quỹ được nhiều nhất với số lần sa thải từ năm 2020 đến năm 2023 là Sau IPO với 2.39.883 lần sa thải, Công ty giai đoạn không xác định với 42.291, Series H với 7.344, Series D với 19.447 và Series E với 13.265 lần sa thải.
Bây giờ, tôi tạo một biểu đồ kép để thể hiện điều này một cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Loại bỏ các đường lưới
- Di chuyển huyền thoại xuống dưới cùng
- Điều chỉnh cả hai trục dọc. (Tôi giải thích điều này trong các biểu đồ trên)
- Thêm tiêu đề biểu đồ và định dạng nó
- Gắn nhãn cho biểu đồ Đường bằng cách chọn tùy chọn “Data Callout”
Điều này được thể hiện dưới dạng “ Sa thải theo tháng ” trên bảng điều khiển.
Bây giờ, tôi tạo một biểu đồ đường để thể hiện điều này một cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Xóa đường lưới và chú giải
- Điều chỉnh trục dọc
- Thêm nhãn dữ liệu
- Điều chỉnh tiêu đề biểu đồ
- Xóa trục dọc
Điều này được thể hiện dưới dạng " Gây quỹ theo ngành " trên bảng điều khiển.
Bây giờ, tôi tạo một biểu đồ đường để thể hiện điều này một cách đơn giản hơn.
Hãy tùy chỉnh biểu đồ này:
- Ẩn tất cả các nút trường
- Xóa đường lưới và chú giải
- Điều chỉnh nhãn trục tung
- Thêm nhãn dữ liệu và định dạng nó
- Thay đổi tiêu đề biểu đồ và định dạng nó
Bùm! Với mọi thứ hiện đã được trình bày trên bảng điều khiển tuyệt vời này, giống như bạn có thể nhìn thấy toàn bộ bức tranh chỉ trong một cú nhấp chuột.
Thành thật mà nói, đây là lần đầu tiên tôi thực hiện một dự án phân tích dữ liệu, vì vậy bất kỳ phản hồi hoặc gợi ý nào từ các chuyên gia ngoài kia đều sẽ được đánh giá cao.
Cảm ơn rất nhiều vì đã xem dự án Excel của tôi và dành thời gian để đọc bài viết này. Hy vọng rằng bạn thấy nó thú vị và nhiều thông tin khi đọc giống như cách tôi tổng hợp lại!
Liên kết Github để tải xuống tệp này: Bấm vào đây
Kết nối với tôi trên LinkedIn và Twitter

![Dù sao thì một danh sách được liên kết là gì? [Phần 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)



































