Como criar cadeias de linhas de maneira eficiente a partir de pontos?

Dec 30 2020

Eu tenho pontos geom em dois quadros de dados separados. O que eu quero fazer é conectar pontos com uma linha (mais tarde em um mapa), por isso quero criar Linestring para cada par de pontos desses quadros de dados. Eu fiz assim:

coordsCust <- table %>%
  st_as_sf(coords = c("lonCust","latCust"), crs = 4326)

coordsApp <- table %>%
  st_as_sf(coords = c("lonApp","latApp"), crs = 4326) %>%
  st_geometry()

e Linestring:

lines <- st_sfc(mapply(function(a,b){
  st_cast(st_union(a,b),"LINESTRING")}, 
  coordsCust$geometry, coordsApp$geometry, SIMPLIFY=FALSE))

Este código funciona, posso criar Linestrings para cada par de pontos, linha por linha:

LINESTRING (14.035 51.65182, 14.33418 53.53346)
LINESTRING (20.42767 49.98073, 16.62978 52.31037)
LINESTRING (20.18762 50.03337, 16.62978 52.31037)
LINESTRING (19.04625 49.79234, 16.62978 52.31037)
LINESTRING (21.35808 50.92382, 16.62978 52.31037)

O problema é que para 30.000 linhas essa solução funciona muito devagar - cerca de 21 segundos. Existe alguma outra maneira de criar cadeias de linhas a partir de pontos? Algo que funciona muito mais rápido? Procurei algumas soluções na web mas foi em vão. Eu li algo sobre como converter sf em matriz e usar, pmapmas não tenho ideia de como implementá-lo aqui.

ATUALIZAÇÃO: se eu quiser usar a função sfheaders :: sf_linestring, preciso juntar geometrias de ambos os conjuntos de dados. Eu faço assim:

df <- cbind(coordsCust,coordsApp)

e o quadro de dados final (mostrei a parte mais importante dele) é mostrado abaixo:

Infelizmente sf_linestring não funciona corretamente neste dataframe. Preciso criar uma cadeia de linha entre PONTOS para cada linha separadamente, conforme mostrado na tela.

Respostas

2 SymbolixAU Dec 30 2020 at 04:49

Sem um conjunto de dados de exemplo, é difícil responder completamente à sua pergunta. Mas se você pode colocar seu data.frame em uma forma 'longa', então sfheaderspode fazer isso em um instante

n <- 30000
df <- data.frame(
  x = rnorm(n)
  , y = rnorm(n)
)

df$id <- rep(1:(n/2), each = 2)

sfheaders::sf_linestring(
  obj = df
  , x = "x"
  , y = "y"
  , linestring_id = "id"
)

# Simple feature collection with 15000 features and 1 field
# geometry type:  LINESTRING
# dimension:      XY
# bbox:           xmin: -4.297631 ymin: -4.118291 xmax: 3.782847 ymax: 4.053399
# CRS:            NA
# First 10 features:
#   id                       geometry
# 1   1 LINESTRING (0.2780517 0.243...
# 2   2 LINESTRING (0.4261505 2.503...
# 3   3 LINESTRING (0.8662821 -0.11...
# 4   4 LINESTRING (-0.5335952 -0.1...
# 5   5 LINESTRING (1.154309 -1.352...
# 6   6 LINESTRING (0.05512324 -0.4...
# 7   7 LINESTRING (1.945868 -0.744...
# 8   8 LINESTRING (0.0427066 -0.08...
# 9   9 LINESTRING (0.06738045 0.41...
# 10 10 LINESTRING (0.4128964 -0.04...