Mahout - Rekomendasi

Bab ini membahas teknik pembelajaran mesin populer yang disebut recommendation, mekanismenya, dan cara menulis aplikasi yang mengimplementasikan rekomendasi Mahout.

Rekomendasi

Pernah bertanya-tanya bagaimana Amazon membuat daftar item yang direkomendasikan untuk menarik perhatian Anda ke produk tertentu yang mungkin Anda minati!

Misalkan Anda ingin membeli buku "Mahout in Action" dari Amazon:

Bersamaan dengan produk yang dipilih, Amazon juga menampilkan daftar item yang direkomendasikan terkait, seperti yang ditunjukkan di bawah ini.

Daftar rekomendasi semacam itu dibuat dengan bantuan recommender engines. Mahout menyediakan mesin rekomender dari beberapa tipe seperti:

  • pemberi rekomendasi berbasis pengguna,
  • rekomendasi berbasis item, dan
  • beberapa algoritma lainnya.

Mesin Rekomendasi Mahout

Mahout memiliki mesin pemberi rekomendasi yang tidak terdistribusi dan tidak berbasis Hadoop. Anda harus memberikan dokumen teks yang memiliki preferensi pengguna untuk item. Dan output dari mesin ini adalah perkiraan preferensi pengguna tertentu untuk item lain.

Contoh

Pertimbangkan situs web yang menjual barang-barang konsumen seperti ponsel, gadget, dan aksesorinya. Jika kita ingin mengimplementasikan fitur Mahout di situs seperti itu, maka kita bisa membangun mesin rekomender. Mesin ini menganalisis data pembelian sebelumnya dari pengguna dan merekomendasikan produk baru berdasarkan itu.

Komponen-komponen yang disediakan Mahout untuk membangun mesin rekomender adalah sebagai berikut:

  • DataModel
  • UserSimilarity
  • ItemSimilarity
  • UserNeighborhood
  • Recommender

Dari penyimpanan data, model data disiapkan dan diteruskan sebagai masukan ke mesin pemberi rekomendasi. Mesin Recommender menghasilkan rekomendasi untuk pengguna tertentu. Diberikan di bawah ini adalah arsitektur mesin pemberi rekomendasi.

Arsitektur Mesin Rekomendasi

Membangun Recommender menggunakan Mahout

Berikut langkah-langkah untuk mengembangkan pemberi rekomendasi sederhana:

Langkah 1: Buat Objek DataModel

Konstruktor PearsonCorrelationSimilarityclass memerlukan objek model data, yang menyimpan file yang berisi detail Pengguna, Item, dan Preferensi dari suatu produk. Berikut ini contoh file model data:

1,00,1.0
1,01,2.0
1,02,5.0
1,03,5.0
1,04,5.0

2,00,1.0
2,01,2.0
2,05,5.0
2,06,4.5
2,02,5.0

3,01,2.5
3,02,5.0
3,03,4.0
3,04,3.0

4,00,5.0
4,01,5.0
4,02,5.0
4,03,0.0

Itu DataModelobjek membutuhkan objek file, yang berisi jalur dari file input. BuatDataModel objek seperti yang ditunjukkan di bawah ini.

DataModel datamodel = new FileDataModel(new File("input file"));

Langkah2: Buat Objek UserSimilarity

Membuat UserSimilarity objek menggunakan PearsonCorrelationSimilarity kelas seperti yang ditunjukkan di bawah ini:

UserSimilarity similarity = new PearsonCorrelationSimilarity(datamodel);

Langkah3: Buat objek UserNe Neighbor

Objek ini menghitung "lingkungan" pengguna seperti pengguna tertentu. Ada dua jenis lingkungan:

  • NearestNUserNeighborhood- Kelas ini menghitung lingkungan yang terdiri dari n pengguna terdekat ke pengguna tertentu. "Terdekat" ditentukan oleh UserSimilarity yang diberikan.

  • ThresholdUserNeighborhood- Kelas ini menghitung lingkungan yang terdiri dari semua pengguna yang kesamaannya dengan pengguna tertentu memenuhi atau melebihi ambang batas tertentu. Kesamaan ditentukan oleh UserSimilarity yang diberikan.

Di sini kami menggunakan ThresholdUserNeighborhood dan setel batas preferensi ke 3.0.

UserNeighborhood neighborhood = new ThresholdUserNeighborhood(3.0, similarity, model);

Step4: Buat Objek Pemberi Rekomendasi

Membuat UserbasedRecomenderobyek. Meneruskan semua objek yang dibuat di atas ke konstruktornya seperti yang ditunjukkan di bawah ini.

UserBasedRecommender recommender = new GenericUserBasedRecommender(model, neighborhood, similarity);

Step5: Merekomendasikan Item ke Pengguna

Merekomendasikan produk kepada pengguna menggunakan metode recommend () dari Recommenderantarmuka. Metode ini membutuhkan dua parameter. Yang pertama mewakili id ​​pengguna dari pengguna yang perlu kami kirimi rekomendasi, dan yang kedua mewakili jumlah rekomendasi yang akan dikirim. Berikut adalah penggunaanrecommender() metode:

List<RecommendedItem> recommendations = recommender.recommend(2, 3);

for (RecommendedItem recommendation : recommendations) {
   System.out.println(recommendation);
 }

Example Program

Diberikan di bawah ini adalah contoh program untuk mengatur rekomendasi. Siapkan rekomendasi untuk pengguna dengan id pengguna 2.

import java.io.File;
import java.util.List;

import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.ThresholdUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;

import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;

import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.UserBasedRecommender;

import org.apache.mahout.cf.taste.similarity.UserSimilarity;

public class Recommender {
   public static void main(String args[]){
      try{
         //Creating data model
         DataModel datamodel = new FileDataModel(new File("data")); //data
      
         //Creating UserSimilarity object.
         UserSimilarity usersimilarity = new PearsonCorrelationSimilarity(datamodel);
      
         //Creating UserNeighbourHHood object.
         UserNeighborhood userneighborhood = new ThresholdUserNeighborhood(3.0, usersimilarity, datamodel);
      
         //Create UserRecomender
         UserBasedRecommender recommender = new GenericUserBasedRecommender(datamodel, userneighborhood, usersimilarity);
        
         List<RecommendedItem> recommendations = recommender.recommend(2, 3);
			
         for (RecommendedItem recommendation : recommendations) {
            System.out.println(recommendation);
         }
      
      }catch(Exception e){}
      
   }
  }

Kompilasi program menggunakan perintah berikut:

javac Recommender.java
java Recommender

Ini harus menghasilkan keluaran berikut:

RecommendedItem [item:3, value:4.5]
RecommendedItem [item:4, value:4.0]