列のマージとその内容のアルファベット順[重複]

Dec 02 2020

issuesdataより大きなフレームから作成したという名前のデータフレームがあります。clean.data

issue1 <- as.vector(clean.data$issue1) issue2 <- as.vector(clean.data$issue2)
issue3 <- as.vector(clean.data$issue3)
issuesdata <- data.frame(issue1, issue2, issue3)

issuesdata %>% dplyr::slice(10:15)
          issue1      issue2      issue3
1       economic        <NA>        <NA>
2       economic unification        <NA>
3       economic        <NA>        <NA>
4 transportation    aviation        <NA>
5        justice        <NA>        <NA>
6        slavery    economic humanrights

私には2つの目標があります。

  1. 一つの文字列(カラム名:内のすべての問題を含む4番目の列が存在するように一緒にこれらの列をマージallissues
  2. の問題のテキストallissuesはアルファベット順になっています

たとえば、の行2はallissues、フォーム内にとどまりますが、economic unification1文字の文字列になります。行4はAviation Transportation、、行6はeconomic humanrights slaveryです。

どうすればこれを行うことができますか?

回答

1 RonakShah Dec 02 2020 at 13:01

NA値を行方向にドロップし、並べ替えて貼り付けます。

ベースR:

issuesdata$combine <- apply(issuesdata, 1, function(x) 
                            toString(sort(na.omit(x))))

またはとdplyr

library(dplyr)

issuesdata %>%
  rowwise() %>%
  mutate(combine = toString(sort(na.omit(c_across()))))

#  issue1         issue2      issue3      combine_data                  
#  <chr>          <chr>       <chr>       <chr>                         
#1 economic       NA          NA          economic                      
#2 economic       unification NA          economic, unification         
#3 economic       NA          NA          economic                      
#4 transportation aviation    NA          aviation, transportation      
#5 justice        NA          NA          justice                       
#6 slavery        economic    humanrights economic, humanrights, slavery