Estimator-spark技术分享

Estimator

Estimator is the contract in Spark MLlib for estimators that fit models to a dataset.

Estimator accepts parameters that you can set through dedicated setter methods upon creating an Estimator. You could also fit a model with extra parameters.



import org.apache.spark.ml.classification.LogisticRegression

// Define parameters upon creating an Estimator
val lr = new LogisticRegression().
  setMaxIter(5).
  setRegParam(0.01)
val training: DataFrame = ...
val model1 = lr.fit(training)

// Define parameters through fit
import org.apache.spark.ml.param.ParamMap
val customParams = ParamMap(
  lr.maxIter -> 10,
  lr.featuresCol -> "custom_features"
)
val model2 = lr.fit(training, customParams)

import org.apache.spark.ml.classification.LogisticRegression

// Define parameters upon creating an Estimator

val lr = new LogisticRegression().

setMaxIter(5).

setRegParam(0.01)

val training: DataFrame = ...

val model1 = lr.fit(training)

// Define parameters through fit

import org.apache.spark.ml.param.ParamMap

val customParams = ParamMap(

lr.maxIter -> 10,

lr.featuresCol -> "custom_features"

)

val model2 = lr.fit(training, customParams)

Estimator is a PipelineStage and so can be a part of a Pipeline.

Estimator Contract



package org.apache.spark.ml

abstract class Estimator[M <: Model[M]] {
  // only required methods that have no implementation
  def fit(dataset: Dataset[_]): M
  def copy(extra: ParamMap): Estimator[M]
}

package org.apache.spark.ml

abstract class Estimator[M <: Model[M]] {

// only required methods that have no implementation

def fit(dataset: Dataset[_]): M

def copy(extra: ParamMap): Estimator[M]

}

Table 1. Estimator Contract
Method	Description
`copy`	Used when…
`fit`	Used when…

Fitting Model with Extra Parameters — `fit` Method



fit(dataset: Dataset[_], paramMap: ParamMap): M

fit(dataset: Dataset[_], paramMap: ParamMap): M

fit copies the extra paramMap and fits a model (of type M).

Note	`fit` is used mainly for model tuning to find the best model (using CrossValidator and TrainValidationSplit).

Estimator

Estimator

Estimator Contract

Fitting Model with Extra Parameters — `fit` Method

相关推荐

欢迎关注：spark技术分享

热门标签

近期文章

分类目录

关注公众号：spark技术分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

QQ咨询

回顶部

Estimator

Estimator Contract

Fitting Model with Extra Parameters — fit Method

相关推荐

欢迎关注：spark技术分享

热门标签

近期文章

分类目录

关注公众号：spark技术分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

QQ咨询

回顶部

Fitting Model with Extra Parameters — `fit` Method