MATLAB - Nhập dữ liệu

Nhập dữ liệu trong MATLAB có nghĩa là tải dữ liệu từ tệp bên ngoài. Cácimportdatacho phép tải nhiều tệp dữ liệu có định dạng khác nhau. Nó có năm dạng sau:

Sr.No. Mô tả chức năng
1

A = importdata(filename)

Tải dữ liệu vào mảng A từ tệp được ký hiệu bằng tên tệp .

2

A = importdata('-pastespecial')

Tải dữ liệu từ khay nhớ tạm thời của hệ thống chứ không phải từ tệp.

3

A = importdata(___, delimiterIn)

Thông dịch delimiterIn làm dấu phân tách cột trong tệp ASCII, tên tệp hoặc dữ liệu khay nhớ tạm. Bạn có thể sử dụng delimiterIn với bất kỳ đối số đầu vào nào trong các cú pháp trên.

4

A = importdata(___, delimiterIn, headerlinesIn)

Tải dữ liệu từ tệp ASCII, tên tệp hoặc khay nhớ tạm, đọc dữ liệu số bắt đầu từ tiêu đề dòngIn + 1 .

5

[A, delimiterOut, headerlinesOut] = importdata(___)

Trả về ký tự dấu phân cách được phát hiện cho tệp ASCII đầu vào trong delimiterOut và số dòng tiêu đề được phát hiện trong headerlinesOut , sử dụng bất kỳ đối số đầu vào nào trong các cú pháp trước đó.

Theo mặc định, Octave không hỗ trợ hàm importdata () , vì vậy bạn sẽ phải tìm kiếm và cài đặt gói này để làm cho các ví dụ sau hoạt động với cài đặt Octave của bạn.

ví dụ 1

Hãy để chúng tôi tải và hiển thị một tệp hình ảnh. Tạo một tệp script và nhập mã sau vào đó:

filename = 'smile.jpg';
A = importdata(filename);
image(A);

Khi bạn chạy tệp, MATLAB sẽ hiển thị tệp hình ảnh. Tuy nhiên, bạn phải lưu trữ nó trong thư mục hiện tại.

Ví dụ 2

Trong ví dụ này, chúng tôi nhập một tệp văn bản và chỉ định Dấu phân cách và Tiêu đề cột. Hãy để chúng tôi tạo một tệp ASCII được phân tách bằng dấu cách với các tiêu đề cột, có tên là weekdata.txt .

Tệp văn bản weekdata.txt của chúng tôi trông như thế này -

SunDay  MonDay  TuesDay  WednesDay  ThursDay  FriDay  SaturDay
95.01   76.21   61.54    40.57       55.79    70.28   81.53
73.11   45.65   79.19    93.55       75.29    69.87   74.68
60.68   41.85   92.18    91.69       81.32    90.38   74.51
48.60   82.14   73.82    41.03       0.99     67.22   93.18
89.13   44.47   57.63    89.36       13.89    19.88   46.60

Tạo một tệp script và nhập mã sau vào đó:

filename = 'weeklydata.txt';
delimiterIn = ' ';
headerlinesIn = 1;
A = importdata(filename,delimiterIn,headerlinesIn);

% View data
for k = [1:7]
   disp(A.colheaders{1, k})
   disp(A.data(:, k))
   disp(' ')
end

Khi bạn chạy tệp, nó sẽ hiển thị kết quả sau:

SunDay
   95.0100
   73.1100
   60.6800
   48.6000
   89.1300
 
MonDay
   76.2100
   45.6500
   41.8500
   82.1400
   44.4700
 
TuesDay
   61.5400
   79.1900
   92.1800
   73.8200
   57.6300

WednesDay
   40.5700
   93.5500
   91.6900
   41.0300
   89.3600
 
ThursDay
   55.7900
   75.2900
   81.3200
   0.9900
   13.8900
 
FriDay
   70.2800
   69.8700
   90.3800
   67.2200
   19.8800

SaturDay
   81.5300
   74.6800
   74.5100
   93.1800
   46.6000

Ví dụ 3

Trong ví dụ này, hãy để chúng tôi nhập dữ liệu từ khay nhớ tạm.

Sao chép các dòng sau vào khay nhớ tạm -

Mathematics is simple

Tạo tệp kịch bản và nhập mã sau:

A = importdata('-pastespecial')

Khi bạn chạy tệp, nó sẽ hiển thị kết quả sau:

A = 
   'Mathematics is simple'

I / O Tệp Cấp thấp

Hàm importdata là một hàm cấp cao. Các chức năng I / O tệp cấp thấp trong MATLAB cho phép kiểm soát nhiều nhất việc đọc hoặc ghi dữ liệu vào tệp. Tuy nhiên, các chức năng này cần thêm thông tin chi tiết về tệp của bạn để hoạt động hiệu quả.

MATLAB cung cấp các hàm sau cho các thao tác đọc và ghi ở cấp độ byte hoặc ký tự:

Chức năng Sự miêu tả
fclose Đóng một hoặc tất cả các tệp đang mở
giả vờ Kiểm tra phần cuối của tệp
nhiệt thành Thông tin về lỗi I / O tệp
fgetl Đọc dòng từ tệp, xóa các ký tự dòng mới
đồ ăn vặt Đọc dòng từ tệp, giữ các ký tự dòng mới
fopen Mở tệp hoặc lấy thông tin về các tệp đang mở
fprintf Ghi dữ liệu vào tệp văn bản
bánh mì Đọc dữ liệu từ tệp nhị phân
tự do Di chuyển chỉ báo vị trí tệp đến đầu tệp đang mở
fscanf Đọc dữ liệu từ tệp văn bản
fseek Di chuyển đến vị trí được chỉ định trong tệp
ftell Vị trí trong tệp đang mở
fwrite Ghi dữ liệu vào tệp nhị phân

Nhập tệp dữ liệu văn bản với I / O cấp thấp

MATLAB cung cấp các chức năng sau để nhập các tệp dữ liệu văn bản ở mức độ thấp:

  • Các fscanf hàm đọc dữ liệu được định dạng trong tệp văn bản hoặc ASCII.

  • Các fgetlfgets các hàm đọc một dòng của tệp tại một thời điểm, trong đó một ký tự dòng mới phân tách mỗi dòng.

  • Các fread hàm đọc một luồng dữ liệu ở mức byte hoặc bit.

Thí dụ

Chúng tôi có một tệp dữ liệu văn bản 'myfile.txt' được lưu trong thư mục làm việc của chúng tôi. Tệp lưu trữ dữ liệu về lượng mưa trong ba tháng; Tháng 6, tháng 7 và tháng 8 trong năm 2012.

Dữ liệu trong myfile.txt chứa các bộ đo thời gian, tháng và lượng mưa lặp lại ở năm địa điểm. Dữ liệu tiêu đề lưu trữ số tháng M; do đó ta có M tập hợp các số đo.

Tệp trông như thế này -

Rainfall Data
Months: June, July, August
 
M = 3
12:00:00
June-2012
17.21  28.52  39.78  16.55 23.67
19.15  0.35   17.57  NaN   12.01
17.92  28.49  17.40  17.06 11.09
9.59   9.33   NaN    0.31  0.23 
10.46  13.17  NaN    14.89 19.33
20.97  19.50  17.65  14.45 14.00
18.23  10.34  17.95  16.46 19.34
09:10:02
July-2012
12.76  16.94  14.38  11.86 16.89
20.46  23.17  NaN    24.89 19.33
30.97  49.50  47.65  24.45 34.00
18.23  30.34  27.95  16.46 19.34
30.46  33.17  NaN    34.89  29.33
30.97  49.50  47.65  24.45 34.00
28.67  30.34  27.95  36.46 29.34
15:03:40
August-2012
17.09  16.55  19.59  17.25 19.22
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67

Chúng tôi sẽ nhập dữ liệu từ tệp này và hiển thị dữ liệu này. Thực hiện các bước sau:

  • Mở tệp bằng fopen và lấy mã định danh tệp.

  • Mô tả dữ liệu trong tệp với format specifiers, nhu la '%s'cho một chuỗi,'%d'cho một số nguyên, hoặc'%f'cho một số dấu phẩy động.

  • Để bỏ qua các ký tự chữ trong tệp, hãy đưa chúng vào mô tả định dạng. Để bỏ qua trường dữ liệu, hãy sử dụng dấu hoa thị ('*') trong mã xác định.

    Ví dụ, để đọc tiêu đề và trả về giá trị duy nhất cho M, chúng ta viết:

    M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
  • Theo mặc định, fscanfđọc dữ liệu theo mô tả định dạng của chúng tôi cho đến khi nó không tìm thấy bất kỳ kết quả phù hợp nào với dữ liệu hoặc đến cuối tệp. Ở đây chúng ta sẽ sử dụng vòng lặp for để đọc 3 tập dữ liệu và mỗi lần, nó sẽ đọc 7 hàng và 5 cột.

  • Chúng tôi sẽ tạo một cấu trúc có tên mydata trong vùng làm việc để lưu trữ dữ liệu đọc từ tệp. Cấu trúc này có ba trường - thời gian , tháng và mảng dữ liệu mưa .

Tạo một tệp script và nhập mã sau vào đó:

filename = '/data/myfile.txt';
rows = 7;
cols = 5;
 
% open the file
fid = fopen(filename);
 
% read the file headers, find M (number of months)
M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
 
% read each set of measurements
for n = 1:M
   mydata(n).time = fscanf(fid, '%s', 1);
   mydata(n).month = fscanf(fid, '%s', 1);
 
   % fscanf fills the array in column order,
   % so transpose the results
   mydata(n).raindata  = ...
      fscanf(fid, '%f', [rows, cols]);
end
for n = 1:M
   disp(mydata(n).time), disp(mydata(n).month)
   disp(mydata(n).raindata)
end
 
% close the file
fclose(fid);

Khi bạn chạy tệp, nó sẽ hiển thị kết quả sau:

12:00:00
June-2012
   17.2100   17.5700   11.0900   13.1700   14.4500
   28.5200       NaN    9.5900       NaN   14.0000
   39.7800   12.0100    9.3300   14.8900   18.2300
   16.5500   17.9200       NaN   19.3300   10.3400
   23.6700   28.4900    0.3100   20.9700   17.9500
   19.1500   17.4000    0.2300   19.5000   16.4600
   0.3500   17.0600   10.4600   17.6500   19.3400

09:10:02
July-2012
   12.7600       NaN   34.0000   33.1700   24.4500
   16.9400   24.8900   18.2300       NaN   34.0000
   14.3800   19.3300   30.3400   34.8900   28.6700
   11.8600   30.9700   27.9500   29.3300   30.3400
   16.8900   49.5000   16.4600   30.9700   27.9500
   20.4600   47.6500   19.3400   49.5000   36.4600
   23.1700   24.4500   30.4600   47.6500   29.3400

15:03:40
August-2012
   17.0900   13.4800   27.2100   11.4500   25.0500
   16.5500   22.5500   26.7900   13.4800   27.2100
   19.5900   24.0100   24.9800   22.5500   26.7900
   17.2500       NaN   12.2300   24.0100   24.9800
   19.2200   21.1900   16.9900       NaN   12.2300
   17.5400   25.8500   18.6700   21.1900   16.9900
   11.4500   25.0500   17.5400   25.8500   18.6700