Получение полного пути от листа до корня для каждого конечного узла с помощью ctree из partykit
Aug 21 2020
В настоящее время я работаю с ctree из пакета R "partykit", и мне было интересно, есть ли способ получить полный путь от терминальных узлов до root. Я хотел бы, чтобы для каждого листа был полный путь к корню, выраженный в виде векторов, содержащих идентификаторы узлов.
library(partykit)
ct <- ctree(Species ~ ., data = iris)
Model formula:
Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width
Fitted party:
[1] root
| [2] Petal.Length <= 1.9: setosa (n = 50, err = 0.0%)
| [3] Petal.Length > 1.9
| | [4] Petal.Width <= 1.7
| | | [5] Petal.Length <= 4.8: versicolor (n = 46, err = 2.2%)
| | | [6] Petal.Length > 4.8: versicolor (n = 8, err = 50.0%)
| | [7] Petal.Width > 1.7: virginica (n = 46, err = 2.2%)
Number of inner nodes: 3
Number of terminal nodes: 4
Построение дерева
Это в основном то, что мне нужно:
[[1]]
[1] 2 1
[[2]]
[1] 5 4 3 1
[[3]]
[1] 6 4 3 1
[[4]]
[1] 7 3 1
Буду признателен за любую помощь! Спасибо!
Ответы
AchimZeileis Aug 23 2020 at 06:48
Следующая функция должна помочь. Первая строка извлекает список дочерних элементов для каждого узла, и из него вы можете рекурсивно пройти по всем узлам.
get_path <- function(object) {
## list of kids per node (NULL if terminal)
kids <- lapply(as.list(object$node), "[[", "kids")
## recursively add node IDs of children
add_ids <- function(x) {
ki <- kids[[x[1L]]]
if(is.null(ki)) {
return(list(x))
} else {
x <- lapply(ki, "c", x)
return(do.call("c", lapply(x, add_ids)))
}
}
add_ids(1L)
}
Затем это можно применить к любому party
объекту:
get_path(ct)
## [[1]]
## [1] 2 1
##
## [[2]]
## [1] 5 4 3 1
##
## [[3]]
## [1] 6 4 3 1
##
## [[4]]
## [1] 7 3 1