Bagaimana cara mengidentifikasi hanya kata-kata yang disatukan oleh "-" di R? [duplikat]
Dec 13 2020
Mari kita asumsikan, saya memiliki teks berikut di R:
x = "The effects in the medium-term of an appreciation of the exchange rate are still to be carefully assessed in our projections. However, we can observe in the short-term that the our pogramme of purchasing asset-backed securities had a positive impact on overall economic activity"
Bagaimana saya bisa mendapatkan hanya yang berikut ini:
# medium-term
# short-term
# asset-backed
Pada dasarnya, saya hanya perlu mengekstrak kata-kata yang dihubungkan dengan "-".
Ada yang bisa bantu saya?
Terima kasih!
Jawaban
1 KarthikS Dec 13 2020 at 17:45
Apakah ini berhasil:
library(stringr)
str_extract_all(x, '\\b[a-z]+-[a-z]+\\b')[[1]]
[1] "medium-term" "short-term" "asset-backed"
1 RonakShah Dec 13 2020 at 17:47
Di basis R, Anda dapat menggunakan:
regmatches(x, gregexpr('\\w+-\\w+', x))[[1]]
#[1] "medium-term" "short-term" "asset-backed"
Jana Duggar: Semua yang Dia Katakan Tentang Cinta dan Jendela 5 Tahunnya untuk Menemukan 'Yang Satu'