Как получить неправильно кластеризованные экземпляры после ClusterEvaluation через последнюю Weka-python-wrapper 0.3.8?

Я изучаю кластеризацию Weka и пытаюсь получить «неправильно кластеризованные экземпляры» после ‘ClusterEvaluation’ с помощью python-weka-wrapper 0.3.8 (python 2.7).

В настоящее время у меня есть атрибут class во входном файле arff, успешно построил модель данных и может получить выходные данные num кластеров & cluster_assignments & кластеризованных экземпляров каждого кластера в обучающем наборе …etc (которые все последовали примеру python-weka-wrapper-examples/src/wekaexamples/clusterers/clusterers.py)

Тем не менее, я хочу знать, правильно ли кластеризован каждый экземпляр как помеченный класс входного arff или нет, а также соотношение неправильно кластеризованных экземпляров (так же, как результат вывода из Weka GUI).

Я не уверен, где установить параметры, как это из Weka GUI v3.8.0 / Explore/Cluster/Cluster mode / Classes to Clusters evaluation before I run the weka.clusterers.Модуль кластеризации.

Есть ли кто-нибудь знает, как сделать mapClasses( http://weka.sourceforge.net/doc.stable/weka/clusterers/ClusterEvaluation.html#mapClasses-int-int-int:A:A-int:A-double:A-double:A-int —) через python-weka-wrapper?

Или в любом случае, чтобы получить отношение результата кластеризованных экземпляров v. s помеченный атрибут класса?

Ценю!

1 ответ

  1. Если Instancesобъект для тестирования имеет набор атрибутов класса при выполнении оценки кластера с помощью ClusterEvaluationкласса, можно использовать classes_to_clustersсвойство для получения сопоставления, которое было собрано при оценке кластеризатора. Эквивалентным методом Java является ClusterEvaluation.getClassesToClusters.
    mapClassesМетод не был представлен как функция Python.