Jak przekonwertować latarkę :: Tensor na cv :: InputArray?

Aug 22 2020

Próbuję użyć cv::getAffineTransform(), ale utknąłem na tym, jak przekształcić tensory w odpowiednie cv::InputArray. Wypróbowałem te, aby zmierzyć się z naruszeniem dostępu:

torch::Tensor src = torch::tensor({ 1.1, 2.0, 3.3 });
torch::Tensor dst = torch::tensor({ 1.1, 2.0, 3.3 });

cv::Mat input_array;
cv::Mat destination_array;
std::memcpy(input_array.data, src.data_ptr<float>(), sizeof(float) * src.numel());
std::memcpy(destination_array.data, dst.data_ptr<float>(), sizeof(float) * dst.numel());

Co ja tu robię źle? Czy istnieje sposób na udostępnienie bazowego bufora i uniknięcie kopiowania w ogóle?

Odpowiedzi

1 Rika Aug 22 2020 at 15:36

Obcina, określając wymiary w pliku cv::Matbyło konieczne do pomyślnego skopiowania! Oznacza to, że musiałem to zrobić:

cv::Mat input_array (3, 1, CV_32FC1);
cv::Mat destination_array (3, 1, CV_32FC1);

std::memcpy(input_array.data, src.data_ptr<float>(), sizeof(float) * src.numel());
std::memcpy(destination_array.data, dst.data_ptr<float>(), sizeof(float) * dst.numel());

std::cout << input_array << std::endl;
std::cout << destination_array << std::endl;

I to już nie prowadzi do naruszenia zasad dostępu. i mogę sprawdzić, czy wartości są kopiowane:

[1.1;
 2;
 3.3]
[1.1;
 2;
 3.3]

Ponieważ poprzedni przykład używał gotowych danych wejściowych, cv::getAffineTransform()nastąpi awaria, więc tutaj jest bardziej realistyczne dane wejściowe i wyjściowe, które możesz uruchomić i zobaczyć, że działa:

Metoda 1: Używanie std::memcpydo kopiowania danych:

torch::Tensor src = torch::tensor({ {137.47012, 62.52604}, {170.50703, 64.21498}, {154.49675, 80.78379} });
torch::Tensor dst = torch::tensor({ {38.294598, 51.6963}, {73.5318, 51.5014}, {56.0252, 71.7366} });

std::cout << "src.shapes: " << src.sizes() << std::endl;
std::cout << "dst.shapes: " << dst.sizes() << std::endl;

int rows = src.sizes()[0];
int cols = (src.sizes().size() == 1) ? 1 : src.sizes()[1];

cv::Mat input_array (rows, cols, CV_32FC1);
cv::Mat destination_array (rows, cols, CV_32FC1);

std::memcpy(input_array.data, src.data_ptr<float>(), sizeof(float) * src.numel());
std::memcpy(destination_array.data, dst.data_ptr<float>(), sizeof(float) * dst.numel());

std::cout << "input_array:\n" << input_array << std::endl;
std::cout << "destination_array:\n" << destination_array << std::endl;

auto tfm = cv::getAffineTransform(input_array, destination_array);
std::cout << "tfm:\n" << tfm << std::endl;

I
metoda 2: Używanie bazowego bufora zamiast kopiowania:

int height = src.sizes()[0];
int width = src.sizes()[1];
cv::Mat input_array(cv::Size{width, height }, CV_32F, src.data_ptr<float>());
cv::Mat destination_array(cv::Size{ width, height }, CV_32F, dst.data_ptr<float>());