आर में प्रारूपण रेखांकन

Nov 22 2020

मैं यह पता लगाने की कोशिश कर रहा हूं कि आर में बनाए गए ग्राफ़ को आसानी से कैसे एक्सेस और हेरफेर किया जाए।

अगर मैं निम्नलिखित डेटा के साथ शुरू करता हूं। मैं एक ग्राफ बनाता हूं, कुछ ग्राफ क्लस्टरिंग चलाता हूं और फिर पहले क्लस्टर की साजिश रचता हूं:

#libraries
 library(igraph)
 library(igraphdata)
 data(karate)

#cluster
 cfg <- cluster_fast_greedy(karate)
 plot(cfg, karate)
cfg

IGRAPH clustering fast greedy, groups: 3, mod: 0.43
+ groups:
  $`1` [1] "Actor 9" "Actor 10" "Actor 15" "Actor 16" "Actor 19" "Actor 21" "Actor 23" "Actor 24" "Actor 25" "Actor 26" "Actor 27" [12] "Actor 28" "Actor 29" "Actor 30" "Actor 31" "Actor 32" "Actor 33" "John A" $`2`
   [1] "Mr Hi"    "Actor 2"  "Actor 3"  "Actor 4"  "Actor 8"  "Actor 12" "Actor 13" "Actor 14" "Actor 18" "Actor 20" "Actor 22"
  
  $`3`
  [1] "Actor 5"  "Actor 6"  "Actor 7"  "Actor 11" "Actor 17"
  
#make a plot of the first community
 a = induced_subgraph(karate, cfg[[1]])
 plot(a)

#biggest graph https://stackoverflow.com/questions/15103744/r-igraph-how-to-find-the-largest-community
 x <- which.max(sizes(cfg))
 subg <- induced.subgraph(karate, which(membership(cfg) == x))

उपयोगकर्ता G5W ने दिखाया कि कैसे एक तालिका बनाई जाए जिसमें प्रत्येक क्लस्टर का आकार हो:

 my_table =  table(cfg$membership)

मैंने यह भी पता लगाया कि कैसे "संक्षेपण" (अनुबंध, सिकुड़ना) सभी प्रेक्षणों को उनके संबंधित समुदायों में शामिल किया जाता है, और फिर एक कथानक बनाया जाता है।

contracted <- simplify(contract(karate,membership(cfg)))
plot(contracted)

तीन समूहों को एक साथ जोड़ने वाली दो "रेखाएं" प्रतीत होती हैं:

किसी को पता है कि क्या यह लाइन "वास्तव में कुछ भी मतलब है"? क्या यह रेखा स्वाभाविक रूप से घटित हो रही है? किस आधार पर यह रेखा इन 3 समूहों को जोड़ती है?

मैंने अपने स्वयं के नेटवर्क डेटा की नकल की, ग्राफ़ क्लस्टरिंग को चलाया, क्लस्टर द्वारा परिणामों का अनुबंध किया और फिर एक प्लॉट बनाया

library(igraph)
library(dplyr)
library(visNetwork)

set.seed(1234)

#create file from which to sample from
x5 <- sample(1:10000, 10000, replace=T)
#convert to data frame
x5 = as.data.frame(x5)

#create first file (take a random sample from the created file)
a = sample_n(x5, 9000)
#create second file (take a random sample from the created file)
b = sample_n(x5, 9000)

#combine
c = cbind(a,b)
#create dataframe
c = data.frame(c)
#rename column names
colnames(c) <- c("a","b")

#create graph
graph <- graph.data.frame(c, directed=F)
graph <- simplify(graph)
cfg <- cluster_fast_greedy(graph)

#contract clusters
contracted <- simplify(contract(graph, membership(cfg), vertex.attr.comb=toString))

#visnetwork plot
visIgraph(contracted) %>% visOptions (highlightNearest = TRUE) %>% visIgraphLayout(layout = "layout_with_fr") %>%
    visOptions(highlightNearest = TRUE, nodesIdSelection = TRUE) %>% 
    visInteraction(navigationButtons = TRUE)

#without visnetwork
plot(contracted)

कुछ क्लस्टर अभी भी एक दूसरे से जुड़े हुए हैं, कुछ अलग-थलग हैं। क्या किसी को पता है कि यह क्यों है?

धन्यवाद

जवाब

2 G5W Nov 23 2020 at 01:41

एक तालिका पाने के लिए जिसमें प्रत्येक क्लस्टर का आकार होता है, उपयोग करें:

table(cfg$membership)
 1  2  3 
18 11  5 

लाइनों का मतलब है कि समूह 1 में कुछ लोग समूह 2 में कुछ से बात करते हैं और समूह 3 में कुछ लोग समूह 2 में लोगों से बात करते हैं, लेकिन समूह 1 में कोई भी समूह 3 में किसी से बात नहीं करता है। उदाहरण के लिए, श्री हाय (समूह 2) अभिनेता 5 (समूह 1) और अभिनेता 32 (समूह 3) से बात करता है।

आपका दूसरा उदाहरण जुड़ा नहीं है। कई जुड़े घटक हैं।

table(COMP$membership)
   1    2    3    4    5    6    7    8    9   10   11
6196    4    7    5    2    2    2    8    2    1    3

   13   14   15   16  17   18 
    2    2    2    2   2    2

बेशक, अनुबंधित ग्राफ में, इन घटकों के बीच कोई लिंक नहीं होगा।