Apache Flink - मशीन लर्निंग

Apache Flink की मशीन लर्निंग लाइब्रेरी को FlinkML कहा जाता है। चूंकि पिछले 5 वर्षों में मशीन लर्निंग का उपयोग तेजी से बढ़ रहा है, फ्लिंक समुदाय ने इस मशीन लर्निंग एपीओ को अपने पारिस्थितिक तंत्र में भी जोड़ने का फैसला किया। FlinkML में योगदानकर्ताओं और एल्गोरिदम की सूची बढ़ रही है। यह एपीआई अभी तक बाइनरी वितरण का हिस्सा नहीं है।

यहाँ फ़्लिंकलएम का उपयोग कर रैखिक प्रतिगमन का एक उदाहरण है -

// LabeledVector is a feature vector with a label (class or real value)
val trainingData: DataSet[LabeledVector] = ...
val testingData: DataSet[Vector] = ...

// Alternatively, a Splitter is used to break up a DataSet into training and testing data.
val dataSet: DataSet[LabeledVector] = ...
val trainTestData: DataSet[TrainTestDataSet] = Splitter.trainTestSplit(dataSet)
val trainingData: DataSet[LabeledVector] = trainTestData.training
val testingData: DataSet[Vector] = trainTestData.testing.map(lv => lv.vector)
val mlr = MultipleLinearRegression()

.setStepsize(1.0)
.setIterations(100)
.setConvergenceThreshold(0.001)
mlr.fit(trainingData)

// The fitted model can now be used to make predictions
val predictions: DataSet[LabeledVector] = mlr.predict(testingData)

के भीतर flink-1.7.1/examples/batch/पथ, आपको KMeans.jar फ़ाइल मिलेगी। आइए हम इस नमूने FlinkML उदाहरण को चलाते हैं।

यह उदाहरण प्रोग्राम डिफ़ॉल्ट बिंदु और सेंट्रो डेटा सेट का उपयोग करके चलाया जाता है।

./bin/flink run examples/batch/KMeans.jar --output Print