Gensim - Bắt đầu

Chương này làm sáng tỏ về các điều kiện tiên quyết để cài đặt Gensim, các phụ thuộc cốt lõi của nó và thông tin về phiên bản hiện tại của nó.

Điều kiện tiên quyết

Để cài đặt Gensim, chúng ta phải cài đặt Python trên máy tính của mình. Bạn có thể truy cập liên kết www.python.org/downloads/ và chọn phiên bản mới nhất cho hệ điều hành của mình, tức là Windows và Linux / Unix. Bạn có thể tham khảo liên kết www.tutorialspoint.com/python3/index.htm để biết hướng dẫn cơ bản về Python. Gensim được hỗ trợ cho Linux, Windows và Mac OS X.

Mã phụ thuộc

Gensim nên chạy trên bất kỳ nền tảng nào hỗ trợ Python 2.7 or 3.5+NumPy. Nó thực sự phụ thuộc vào phần mềm sau:

Python

Gensim được thử nghiệm với các phiên bản Python 2.7, 3.5, 3.6 và 3.7.

Numpy

Như chúng ta đã biết, NumPy là một gói dành cho tính toán khoa học với Python. Nó cũng có thể được sử dụng như một nơi chứa dữ liệu chung đa chiều hiệu quả. Gensim phụ thuộc vào gói NumPy để bẻ khóa số. Để có hướng dẫn cơ bản về Python, bạn có thể tham khảo liên kết www.tutorialspoint.com/numpy/index.htm .

smart_open

smart_open, một thư viện Python 2 & Python 3, được sử dụng để phát trực tuyến hiệu quả các tệp rất lớn. Nó hỗ trợ truyền trực tuyến từ / đến các kho lưu trữ như S3, HDFS, WebHDFS, HTTP, HTTPS, SFTP hoặc hệ thống tệp cục bộ. Gensim phụ thuộc vàosmart_open Thư viện Python để mở tệp trong bộ lưu trữ từ xa cũng như tệp nén.

Phiên bản hiện tại

Phiên bản hiện tại của Gensim là 3.8.0 được phát hành vào tháng 7 năm 2019.

Cài đặt bằng thiết bị đầu cuối

Một trong những cách đơn giản nhất để cài đặt Gensim là chạy lệnh sau trong thiết bị đầu cuối của bạn:

pip install --upgrade gensim

Cài đặt bằng Môi trường Conda

Một cách thay thế để tải xuống Gensim là sử dụng condaMôi trường. Chạy lệnh sau trongconda thiết bị đầu cuối -

conda install –c conda-forge gensim

Cài đặt bằng gói nguồn

Giả sử, nếu bạn đã tải xuống và giải nén gói nguồn, thì bạn cần chạy các lệnh sau:

python setup.py test
python setup.py install