Tham nhũng bộ nhớ có phải là một vấn đề phổ biến trong các chương trình lớn được viết bằng hợp ngữ không?

Jan 21 2021

Lỗi hỏng bộ nhớ luôn là một vấn đề phổ biến trong các chương trình và dự án C lớn. Đó là một vấn đề trong 4.3BSD hồi đó, và nó vẫn là một vấn đề cho đến ngày nay. Cho dù chương trình được viết cẩn thận đến đâu, nếu nó đủ lớn, bạn thường có thể phát hiện ra một lỗi đọc hoặc ghi không liên quan khác trong mã.

Nhưng đã có lúc các chương trình lớn, bao gồm cả hệ điều hành, được viết bằng assembly chứ không phải C. Lỗi hỏng bộ nhớ có phải là vấn đề phổ biến trong các chương trình lắp ráp lớn không? Và nó đã so sánh với các chương trình C như thế nào?

Trả lời

53 Jean-FrançoisFabre Jan 21 2021 at 17:23

Mã hóa trong lắp ráp là rất tàn bạo.

Con trỏ giả mạo

Các ngôn ngữ hợp ngữ thậm chí còn dựa nhiều hơn vào các con trỏ (thông qua các thanh ghi địa chỉ), vì vậy bạn thậm chí không thể dựa vào trình biên dịch hoặc các công cụ phân tích tĩnh để cảnh báo bạn về các lỗi bộ nhớ / tràn bộ đệm như trái ngược với C.

Ví dụ trong C, một trình biên dịch tốt có thể đưa ra cảnh báo ở đó:

 char x[10];
 x[20] = 'c';

Đó là giới hạn. Ngay sau khi mảng phân rã thành một con trỏ, các kiểm tra như vậy không thể được thực hiện, nhưng đó là một sự bắt đầu.

Trong lắp ráp, nếu không có thời gian chạy thích hợp hoặc các công cụ nhị phân thực thi chính thức, bạn không thể phát hiện ra các lỗi như vậy.

Đăng ký Rogue (chủ yếu là địa chỉ)

Một yếu tố trầm trọng khác đối với việc lắp ráp là quy ước bảo quản thanh ghi và quy ước gọi thông thường không được đảm bảo / tiêu chuẩn.

Nếu một quy trình được gọi và không lưu một sổ đăng ký cụ thể do nhầm lẫn, thì nó sẽ trở lại người gọi với một đăng ký đã sửa đổi (bên cạnh các đăng ký "đầu" được biết là được chuyển vào thùng rác khi thoát) và người gọi không mong đợi nó, dẫn đến việc đọc / ghi đến địa chỉ không chính xác. Ví dụ trong mã 68k:

    move.b  d0,(a3)+
    bsr  a_routine
    move.b  d0,(a3)+   ; memory corruption, a3 has changed unexpectedly
    ...

a_routine:
    movem.l a0-a2,-(a7)
    ; do stuff
    lea some_table(pc),a3    ; change a3 if some condition is met
    movem.l (a7)+,a0-a2   ; the routine forgot to save a3 !
    rts

Sử dụng một quy trình được viết bởi người khác không sử dụng cùng quy ước lưu đăng ký có thể dẫn đến cùng một vấn đề. Tôi thường lưu tất cả các đăng ký trước khi sử dụng thói quen của người khác.

Mặt khác, một trình biên dịch sử dụng việc truyền tham số ngăn xếp hoặc thanh ghi tiêu chuẩn, xử lý các biến cục bộ bằng cách sử dụng ngăn xếp / thiết bị khác, lưu giữ các thanh ghi nếu cần và tất cả đều thống nhất trong toàn bộ chương trình, được đảm bảo bởi trình biên dịch (trừ khi có lỗi, của khóa học)

Chế độ địa chỉ giả mạo

Tôi đã sửa rất nhiều lỗi vi phạm bộ nhớ trong các trò chơi Amiga cổ đại. Việc chạy chúng trong môi trường ảo có kích hoạt MMU đôi khi gây ra lỗi đọc / ghi trong các địa chỉ không có thật. Hầu hết thời gian những lần đọc / ghi đó không có tác dụng vì các lần đọc trả về 0 và các lần ghi đi trong rừng, nhưng tùy thuộc vào cấu hình bộ nhớ, nó có thể gây ra những hậu quả khó chịu.

Cũng có trường hợp giải quyết lỗi. Tôi thấy những thứ như:

 move.l $40000,a0

thay vì ngay lập tức

 move.l #$40000,a0

trong trường hợp đó, thanh ghi địa chỉ chứa những gì trong $40000(có thể là thùng rác) chứ không phải $40000địa chỉ. Điều này dẫn đến sự hỏng bộ nhớ nghiêm trọng trong một số trường hợp. Trò chơi thường kết thúc hành động không hoạt động ở một nơi khác mà không sửa lỗi này để trò chơi hoạt động bình thường trong hầu hết thời gian. Nhưng có những lúc các trò chơi phải được sửa đúng cách để khôi phục lại hành vi thích hợp.

Trong C, việc đánh giá sai một giá trị cho một con trỏ dẫn đến một cảnh báo.

(Chúng tôi đã từ bỏ một trò chơi chẳng hạn như "Wicked" có càng nhiều hỏng hóc về đồ họa khi bạn lên cấp càng cao, nhưng cũng tùy thuộc vào cách bạn vượt qua các cấp và thứ tự của chúng ...)

Kích thước dữ liệu không hợp lệ

Trong lắp ráp, không có loại nào. Nó có nghĩa là nếu tôi làm

move.w #$4000,d0           ; copy only 16 bits
move.l #1,(a0,d0.l)    ; indexed write on d1, long

thanh d0ghi chỉ được thay đổi một nửa dữ liệu. Có thể là những gì tôi muốn, có thể không. Sau đó, nếu d0chứa số 0 trên hầu hết các bit 32-16 quan trọng, mã sẽ thực hiện những gì được mong đợi, nếu không, nó sẽ thêm a0d0(toàn dải) và kết quả ghi là "in the woods". Cách khắc phục là:

move.l #1,(a0,d0.w)    ; indexed write on d1, long

Nhưng sau đó if d0> $7FFFnó cũng làm điều gì đó sai, vì khi đó d0được coi là tiêu cực (không phải trường hợp với d0.l). Vì vậy, d0cần mở rộng dấu hiệu hoặc mặt nạ ...

Các lỗi kích thước đó có thể được nhìn thấy trên mã C, chẳng hạn như khi gán cho một shortbiến (cắt bớt kết quả) nhưng ngay cả sau đó bạn chỉ nhận được một kết quả sai hầu hết thời gian, không phải các vấn đề nghiêm trọng như trên (nghĩa là: nếu bạn không 'không nói dối trình biên dịch bằng cách buộc các phôi loại sai)

Trình lắp ráp không có loại nào, nhưng trình lắp ráp tốt cho phép sử dụng các cấu trúc ( STRUCTtừ khóa) cho phép nâng cao mã một chút bằng cách tự động tính toán các hiệu số cấu trúc. Nhưng việc đọc kích thước xấu có thể là thảm họa cho dù bạn có đang sử dụng cấu trúc / hiệu số được xác định hay không

move.w  the_offset(a0),d0

thay vì

move.l  the_offset(a0),d0

không được kiểm tra và cung cấp cho bạn dữ liệu sai d0. Đảm bảo rằng bạn uống đủ cà phê trong khi viết mã, hoặc chỉ cần viết tài liệu thay thế ...

Căn chỉnh dữ liệu không đúng

Trình hợp dịch thường cảnh báo về mã không được căn chỉnh, nhưng không phải về con trỏ không được căn chỉnh (vì con trỏ không có kiểu), có thể gây ra lỗi xe buýt.

Các ngôn ngữ cấp cao sử dụng các loại và tránh hầu hết các lỗi đó bằng cách thực hiện căn chỉnh / đệm (trừ khi, một lần nữa, nói dối).

Tuy nhiên, bạn có thể viết thành công các chương trình hợp ngữ. Bằng cách sử dụng một phương pháp nghiêm ngặt để truyền tham số / lưu đăng ký và bằng cách cố gắng che 100% mã của bạn bằng các bài kiểm tra và trình gỡ lỗi (tượng trưng hoặc không, đây vẫn là mã mà bạn đã viết). Điều đó sẽ không loại bỏ tất cả các lỗi tiềm ẩn, đặc biệt là những lỗi gây ra bởi dữ liệu đầu vào sai, nhưng nó sẽ hữu ích.

24 jackbochsler Jan 22 2021 at 05:41

Tôi đã dành phần lớn thời gian trong sự nghiệp của mình để viết hợp ngữ, solo, nhóm nhỏ và nhóm lớn (Cray, SGI, Sun, Oracle). Tôi đã làm việc trên các hệ thống nhúng, hệ điều hành, máy ảo và bộ tải bootstrap. Bộ nhớ hiếm khi bị hỏng nếu đã từng là một vấn đề. Chúng tôi đã thuê những người nhạy bén, và những người thất bại được quản lý vào những công việc khác phù hợp hơn với kỹ năng của họ.

Chúng tôi cũng đã thử nghiệm một cách cuồng nhiệt - cả ở cấp độ đơn vị và cấp độ hệ thống. Chúng tôi đã thử nghiệm tự động chạy liên tục cả trên trình mô phỏng và phần cứng thực.

Gần cuối sự nghiệp của mình, tôi đã phỏng vấn với một công ty và tôi đã hỏi về cách họ thực hiện thử nghiệm tự động. Phản ứng của họ là "Cái gì?!?" là tất cả những gì tôi cần nghe, tôi đã kết thúc cuộc phỏng vấn.

19 RETRAC Jan 21 2021 at 23:10

Rất nhiều lỗi vớ vẩn trong lắp ráp, cho dù bạn có cẩn thận đến đâu. Nó chỉ ra rằng ngay cả những trình biên dịch ngu ngốc cho các ngôn ngữ cấp cao được xác định kém (như C) cũng hạn chế một loạt các lỗi có thể xảy ra là không hợp lệ về ngữ nghĩa hoặc cú pháp. Một sai sót với một lần nhấn phím thừa hoặc quên có nhiều khả năng từ chối biên dịch hơn là lắp ráp. Các cấu trúc bạn có thể diễn đạt hợp lệ trong assembly không có ý nghĩa gì vì bạn đang làm sai thì ít có khả năng chuyển thành một thứ được chấp nhận là hợp lệ C. Và vì bạn đang hoạt động ở cấp độ cao hơn, bạn nhiều khả năng sẽ liếc nhìn nó và "hả?" và viết lại con quái vật bạn vừa viết.

Vì vậy, việc phát triển và gỡ lỗi lắp ráp thực sự là không thể tha thứ. Nhưng hầu hết các lỗi như vậy đều khó phá vỡ mọi thứ và sẽ hiển thị trong quá trình phát triển và gỡ lỗi. Tôi sẽ đánh giá cao sự phỏng đoán có học thức rằng, nếu các nhà phát triển đang tuân theo cùng một kiến ​​trúc cơ bản và cùng các phương pháp phát triển tốt, thì sản phẩm cuối cùng phải mạnh mẽ như vậy. Loại lỗi mà trình biên dịch mắc phải có thể mắc phải với các phương pháp phát triển tốt, và loại lỗi mà trình biên dịch không mắc phải có thể mắc hoặc không với các phương pháp như vậy. Tuy nhiên, sẽ mất nhiều thời gian hơn để đạt được cùng một cấp độ.

14 WalterMitty Jan 23 2021 at 02:48

Tôi đã viết trình thu gom rác ban đầu cho MDL, một ngôn ngữ giống Lisp, vào năm 1971-72. Đó là một thách thức đối với tôi hồi đó. Nó được viết bằng MIDAS, một trình hợp dịch cho PDP-10 chạy ITS.

Tránh hỏng bộ nhớ là tên của trò chơi trong dự án đó. Toàn bộ nhóm đã sợ hãi về một bản demo thành công bị rơi và cháy khi trình thu gom rác được gọi. Và tôi không có kế hoạch gỡ lỗi thực sự tốt cho mã đó. Tôi đã kiểm tra bàn làm việc nhiều hơn tôi đã từng làm trước đây hoặc kể từ đó. Nội dung như đảm bảo không có lỗi ở cột hàng rào. Đảm bảo rằng khi một nhóm vectơ được di chuyển, mục tiêu không chứa bất kỳ loại không phải rác nào. Nhiều lần, thử nghiệm các giả định của tôi.

Tôi không bao giờ tìm thấy bất kỳ lỗi nào trong mã đó, ngoại trừ những lỗi được tìm thấy bằng cách kiểm tra tại bàn. Sau khi chúng tôi phát trực tiếp, không có cái nào xuất hiện trong suốt thời gian tôi theo dõi.

Rõ ràng là tôi không còn thông minh như năm mươi năm trước. Tôi không thể làm bất cứ điều gì như vậy ngày hôm nay. Và các hệ thống ngày nay lớn hơn MDL hàng nghìn lần.

7 Raffzahn Jan 22 2021 at 00:00

Lỗi hỏng bộ nhớ luôn là một vấn đề phổ biến trong các chương trình C lớn [...] Nhưng đã có lúc các chương trình lớn, bao gồm cả hệ điều hành, được viết bằng assembly chứ không phải C.

Bạn có biết rằng có những ngôn ngữ khác đã khá phổ biến từ rất sớm không? Thích COBOL, FORTRAN hay PL / 1?

Lỗi hỏng bộ nhớ có phải là một vấn đề phổ biến trong các chương trình lắp ráp lớn không?

Tất nhiên, điều này phụ thuộc vào nhiều yếu tố, như

  • Trình lắp ráp được sử dụng, vì các chương trình trình hợp dịch khác nhau cung cấp mức độ hỗ trợ lập trình khác nhau.
  • cấu trúc chương trình, đặc biệt là các chương trình lớn tuân theo cấu trúc có thể kiểm tra
  • modularisation và giao diện rõ ràng
  • loại chương trình được viết, vì không phải mọi tác vụ đều yêu cầu con trỏ loay hoay
  • phong cách thực hành tốt nhất

Một trình hợp dịch giỏi không chỉ đảm bảo rằng dữ liệu được căn chỉnh mà còn cung cấp các công cụ để xử lý các kiểu dữ liệu, cấu trúc phức tạp và giống nhau theo kiểu trừu tượng, giảm nhu cầu tính toán con trỏ 'thủ công'.

Trình hợp dịch được sử dụng cho bất kỳ dự án nghiêm túc nào luôn là trình hợp dịch macro (* 1), do đó có khả năng mã hóa các hoạt động nguyên thủy thành các lệnh macro cấp cao hơn, cho phép lập trình tập trung vào ứng dụng hơn trong khi tránh được nhiều cạm bẫy khi xử lý con trỏ (* 2).

Các loại chương trình cũng có ảnh hưởng khá lớn. Các ứng dụng thường bao gồm các mô-đun khác nhau, nhiều mô-đun có thể được viết gần như hoặc hoàn chỉnh mà không (hoặc chỉ được kiểm soát) sử dụng con trỏ. Một lần nữa, việc sử dụng các công cụ do trình hợp dịch cung cấp là chìa khóa để mã ít bị lỗi hơn.

Tiếp theo sẽ là phương pháp hay nhất - đi đôi với nhiều phương pháp trước đó. Đơn giản là không viết các chương trình / mô-đun cần nhiều thanh ghi cơ sở, điều này sẽ chuyển giao khối bộ nhớ lớn thay vì cấu trúc yêu cầu chuyên dụng, v.v.

Nhưng thực hành tốt nhất bắt đầu từ rất sớm và với những điều dường như đơn giản. Chỉ cần lấy ví dụ về một CPU nguyên thủy (xin lỗi) như 6502 có thể có một tập hợp các bảng, tất cả đều được điều chỉnh theo đường viền trang để có hiệu suất. Khi tải địa chỉ của một trong các bảng này vào con trỏ trang 0 để truy cập được lập chỉ mục, việc sử dụng các công cụ mà trình hợp dịch có nghĩa là phải thực hiện

     LDA   #<Table
     STA   Pointer

Khá nhiều chương trình tôi đã xem thay vì đi

     LDA   #0
     STA   Pointer

(hoặc tệ hơn, nếu trên 65C02)

     STZ   Pointer

Lập luận thông thường là "Nhưng dù sao thì nó cũng thẳng hàng". Là nó? Điều đó có thể được đảm bảo cho tất cả các lần lặp lại trong tương lai không? Điều gì về một ngày nào đó khi không gian địa chỉ trở nên chật hẹp và chúng cần được chuyển đến các địa chỉ không được căn chỉnh? Có rất nhiều lỗi lớn (hay còn gọi là khó tìm) được mong đợi.

Vì vậy, Thực hành tốt nhất một lần nữa đưa chúng ta trở lại sử dụng Trình lắp ráp và tất cả các công cụ mà nó cung cấp.

Đừng cố gắng chơi Assembler thay vì Assembler - hãy để anh ấy làm công việc của mình cho bạn.

Và sau đó là thời gian chạy, một thứ áp dụng cho tất cả các ngôn ngữ nhưng thường bị lãng quên. Bên cạnh những thứ như kiểm tra ngăn xếp hoặc kiểm tra giới hạn trên các tham số, một trong những cách hiệu quả nhất để bắt lỗi con trỏ chỉ đơn giản là khóa trang bộ nhớ cuối cùng đầu tiên chống lại việc ghi và đọc (* 3). Nó không chỉ bắt tất cả các lỗi con trỏ null yêu thích, mà còn tất cả các số dương hoặc âm thấp thường là kết quả của một số lập chỉ mục trước đó bị sai. Chắc chắn, Runtime luôn là phương sách cuối cùng, nhưng đây là phương án dễ dàng.

Trên hết, có lẽ lý do liên quan nhất là

  • ISA của máy

giảm nguy cơ hỏng bộ nhớ bằng cách giảm nhu cầu xử lý với con trỏ.

Một số cấu trúc CPU chỉ yêu cầu ít hoạt động con trỏ (trực tiếp) hơn các cấu trúc khác. Có một khoảng cách rất lớn giữa các kiến ​​trúc bao gồm hoạt động của bộ nhớ với bộ nhớ so với những kiến ​​trúc không có, như kiến ​​trúc tải / lưu trữ dựa trên bộ tích lũy. Vốn dĩ yêu cầu xử lý con trỏ cho bất kỳ thứ gì lớn hơn một phần tử đơn lẻ (byte / từ).

Ví dụ: để chuyển một trường, giả sử tên khách hàng từ xung quanh trong bộ nhớ, a / 360 sử dụng một thao tác MVC duy nhất với các địa chỉ và độ dài truyền được tạo bởi trình hợp dịch từ định nghĩa dữ liệu, trong khi kiến ​​trúc tải / lưu trữ, được thiết kế để xử lý từng byte riêng biệt, phải thiết lập con trỏ và độ dài trong thanh ghi và lặp xung quanh một phần tử đơn lẻ đang chuyển động.

Vì các hoạt động như vậy khá phổ biến, dẫn đến khả năng xảy ra lỗi cũng phổ biến. Hoặc, một cách tổng quát hơn, có thể nói rằng:

Các chương trình dành cho bộ xử lý CISC thường ít bị lỗi hơn các chương trình được viết cho máy RISC.

Tất nhiên và như thường lệ, mọi thứ có thể bị trục trặc bởi lập trình tồi.

Và nó đã so sánh với các chương trình C như thế nào?

Cũng giống như vậy - hoặc tốt hơn, C là tương đương HLL của ISA CPU nguyên thủy nhất, vì vậy bất kỳ thứ gì cung cấp hướng dẫn cấp cao hơn sẽ tốt hơn.

C vốn là một ngôn ngữ RISCy. Các hoạt động được cung cấp được giảm xuống mức tối thiểu, đi kèm với khả năng tối thiểu để kiểm tra các hoạt động không mong muốn. Sử dụng con trỏ không được kiểm tra không chỉ là tiêu chuẩn mà còn cần thiết cho nhiều hoạt động, mở ra nhiều khả năng làm hỏng bộ nhớ.

Ngược lại với một HLL như ADA, ở đây hầu như không thể tạo ra sự tàn phá con trỏ - trừ khi nó được dự định và khai báo rõ ràng là tùy chọn. Một phần tốt của nó là (giống như với ISA trước đây) do các kiểu dữ liệu cao hơn và xử lý chúng theo cách an toàn.


Về phần kinh nghiệm, tôi đã làm hầu hết cuộc đời nghề nghiệp của mình (> 30 năm) trong các dự án Lắp ráp, với 80% Mainframe (/ 370) 20% Micros (chủ yếu là 8080 / x86) - cộng thêm nhiều thứ khác :) lớn tới hơn 2 triệu LOC (chỉ hướng dẫn) trong khi các dự án vi mô giữ khoảng 10-20 nghìn LOC.


* 1 - Không, thứ gì đó cung cấp việc thay thế các đoạn văn bản bằng văn bản tạo sẵn tốt nhất là một số bộ xử lý tiền văn bản, nhưng không phải là bộ hợp dịch macro. Trình hợp dịch macro là một công cụ meta để tạo ngôn ngữ cần thiết cho một dự án. Nó cung cấp các công cụ để khai thác thông tin mà trình hợp dịch thu thập được về nguồn (kích thước trường, loại trường và nhiều thứ khác) cũng như các cấu trúc điều khiển để tạo công thức xử lý, được sử dụng để tạo mã thích hợp.

* 2 - Thật dễ dàng để phàn nàn rằng C không phù hợp với bất kỳ khả năng vĩ mô nghiêm trọng nào, nó không chỉ loại bỏ nhu cầu về nhiều cấu trúc khó hiểu, mà còn tạo ra nhiều tiến bộ bằng cách mở rộng ngôn ngữ mà không cần phải viết một cấu trúc mới.

* 3 - Cá nhân tôi thích làm cho trang 0 chỉ ghi được bảo vệ và điền vào 256 byte đầu tiên bằng số 0 nhị phân. Bằng cách đó, tất cả các lần ghi con trỏ null (hoặc thấp) vẫn dẫn đến lỗi máy, nhưng việc đọc từ con trỏ null sẽ trả về, tùy thuộc vào loại, byte / halfword / word / doublewort chứa zero - well, hoặc null-string :) Tôi biết, đó là sự lười biếng, nhưng nó khiến cuộc sống trở nên thú vị hơn nhiều nếu một người dễ dàng không hợp tác với những người khác code Ngoài ra, trang còn lại có thể được sử dụng cho các giá trị hằng số tiện dụng như con trỏ đến các nguồn toàn cầu khác nhau, chuỗi ID, nội dung trường không đổi và dịch bảng.

6 waltinator Jan 22 2021 at 09:17

Tôi đã viết các mod hệ điều hành trong lắp ráp trên CDC G-21, Univac 1108, DECSystem-10, DECSystem-20, tất cả các hệ thống 36 bit, cộng với 2 trình lắp ráp IBM 1401.

"Bộ nhớ bị hỏng" tồn tại, hầu hết là một mục trong danh sách "Những việc không nên làm".

Trên Univac 1108, tôi đã tìm thấy lỗi phần cứng trong đó tìm nạp nửa từ đầu tiên (địa chỉ trình xử lý ngắt) sau khi ngắt phần cứng sẽ trả về tất cả các giá trị 1, thay vì nội dung của địa chỉ. Đi vào đám cỏ dại, với các ngắt bị tắt, không có bảo vệ bộ nhớ. Vòng và vòng nó đi, nó dừng ở đâu không ai biết.

5 Peter-ReinstateMonica Jan 22 2021 at 19:31

Bạn đang so sánh táo và lê. Các ngôn ngữ cấp cao được phát minh bởi vì các chương trình đạt đến kích thước không thể quản lý được bằng trình hợp dịch. Ví dụ: "V1 có 4.501 dòng mã lắp ráp cho nhân, khởi tạo và trình bao của nó. Trong đó, 3.976 dòng cho nhân và 374 cho trình bao." (Từ câu trả lời này .)

Các. V1. Vỏ. Đã có. 347. Đường nét. Của. Mã.

Bash ngày nay có thể có 100.000 dòng mã (một wc trên repo mang lại 170k), không tính các thư viện trung tâm như readline và localization. Các ngôn ngữ cấp cao được sử dụng một phần vì tính di động nhưng cũng vì hầu như không thể viết các chương trình có kích thước ngày nay trong trình hợp dịch. Nó không chỉ dễ xảy ra lỗi hơn - nó không thể xảy ra.

4 supercat Jan 22 2021 at 03:45

Tôi không nghĩ rằng tham nhũng bộ nhớ nói chung là một vấn đề trong hợp ngữ hơn bất kỳ ngôn ngữ nào khác sử dụng các hoạt động chỉ mục mảng không được kiểm tra, khi so sánh các chương trình thực hiện các tác vụ tương tự. Mặc dù việc viết mã hợp ngữ chính xác có thể yêu cầu chú ý đến các chi tiết ngoài những chi tiết có liên quan trong một ngôn ngữ như C, một số khía cạnh của hợp ngữ thực sự an toàn hơn C. Trong hợp ngữ, nếu mã thực hiện một chuỗi tải và lưu trữ, một trình hợp dịch sẽ tạo ra các hướng dẫn tải và lưu trữ theo thứ tự đã cho mà không cần đặt câu hỏi liệu chúng có cần thiết hay không. Ngược lại, trong C, nếu một trình biên dịch thông minh như clang được gọi với bất kỳ cài đặt tối ưu hóa nào khác ngoài -O0và đưa ra một cái gì đó như:

extern char x[],y[];
int test(int index)
{
    y[0] = 1;
    if (x+2 == y+index)
        y[index] = 2;
    return y[0];
}

nó có thể xác định rằng giá trị y[0]khi returncâu lệnh thực thi sẽ luôn là 1 và do đó không cần tải lại giá trị của nó sau khi ghi vào y[index], mặc dù trường hợp xác định duy nhất mà việc ghi vào chỉ mục có thể xảy ra là nếu x[]là hai byte, y[]xảy ra ngay lập tức theo sau nó, và indexlà số 0, ngụ ý rằng y[0]thực sự sẽ được giữ nguyên số 2.

3 phyrfox Jan 23 2021 at 23:33

Assembler yêu cầu kiến ​​thức sâu sắc hơn về phần cứng bạn đang sử dụng so với các ngôn ngữ khác như C hoặc Java. Tuy nhiên, sự thật là trình lắp ráp đã được sử dụng trong hầu hết mọi thứ, từ những chiếc ô tô được máy tính hóa đầu tiên, các hệ thống trò chơi điện tử đầu tiên cho đến những năm 1990, cho đến các thiết bị Internet-of-Things mà chúng ta sử dụng ngày nay.

Trong khi C cung cấp an toàn kiểu, nó vẫn không cung cấp các biện pháp an toàn khác như kiểm tra con trỏ vô hiệu hoặc mảng bị giới hạn (ít nhất, không phải là không có mã bổ sung). Khá dễ dàng để viết một chương trình sẽ bị treo và cháy cũng như bất kỳ chương trình trình hợp ngữ nào.

Hàng chục ngàn trò chơi video đã được viết bằng assembler, compos viết demo nhỏ nhưng ấn tượng chỉ trong một vài kilobyte mã / dữ liệu trong nhiều thập kỷ nay, hàng ngàn chiếc xe vẫn sử dụng một số hình thức lắp ráp hiện nay, cũng như một vài ít được biết đến hệ điều hành (ví dụ: MenuetOS ). Bạn có thể có hàng tá, thậm chí hàng trăm thứ trong nhà đã được lập trình trong trình lắp ráp mà bạn thậm chí không biết.

Vấn đề chính với lập trình hợp ngữ là bạn cần phải lập kế hoạch mạnh mẽ hơn so với việc bạn làm bằng ngôn ngữ như C. Hoàn toàn có thể viết một chương trình với thậm chí 100 nghìn dòng mã trong trình hợp dịch mà không có một lỗi nào và bạn cũng có thể viết một chương trình chương trình gồm 20 dòng mã có 5 lỗi.

Vấn đề không phải là công cụ, mà là lập trình viên. Tôi có thể nói rằng hỏng bộ nhớ là một vấn đề phổ biến trong lập trình ban đầu nói chung. Điều này không chỉ giới hạn ở trình hợp dịch, mà còn cả C (vốn nổi tiếng là làm rò rỉ bộ nhớ và truy cập vào các phạm vi bộ nhớ không hợp lệ), C ++ và các ngôn ngữ khác mà bạn có thể truy cập trực tiếp vào bộ nhớ, thậm chí là BASIC (có khả năng đọc / ghi I / cụ thể Các cổng O trên CPU).

Ngay cả với các ngôn ngữ hiện đại có bảo vệ an toàn, chúng ta sẽ thấy các lỗi lập trình làm hỏng trò chơi. Tại sao? Bởi vì không có đủ sự quan tâm trong việc thiết kế ứng dụng. Quản lý bộ nhớ đã không biến mất, nó được đặt vào một góc khó hình dung hơn, gây ra tất cả các loại tàn phá ngẫu nhiên trong mã hiện đại.

Hầu như mọi ngôn ngữ đều dễ bị hỏng bộ nhớ nếu sử dụng không đúng cách. Ngày nay, vấn đề phổ biến nhất là rò rỉ bộ nhớ, điều này dễ dàng hơn bao giờ hết khi vô tình giới thiệu do đóng và trừu tượng.

Thật không công bằng khi nói rằng trình dịch hợp ngữ vốn đã ít nhiều làm hỏng bộ nhớ so với các ngôn ngữ khác, nó chỉ có một đoạn rap tệ vì khó khăn như thế nào để viết mã thích hợp.

2 JohnDoty Jan 23 2021 at 02:12

Đó là một vấn đề rất phổ biến. Trình biên dịch FORTRAN của IBM cho 1130 có khá nhiều: những trình tôi nhớ có liên quan đến các trường hợp sai cú pháp không được phát hiện. Việc chuyển sang các ngôn ngữ cấp gần máy rõ ràng không giúp ích được gì: các hệ thống Multics ban đầu được viết bằng PL / I thường xuyên gặp sự cố. Tôi nghĩ rằng văn hóa và kỹ thuật lập trình có liên quan nhiều hơn đến việc cải thiện tình trạng này hơn là ngôn ngữ đã làm.

2 JohnDallman Jan 24 2021 at 21:26

Tôi đã thực hiện một vài năm lập trình trình hợp dịch, sau đó là hàng chục năm của C. Các chương trình trình lắp ráp dường như không có nhiều lỗi con trỏ tồi hơn C, nhưng một lý do quan trọng cho điều đó là lập trình trình hợp dịch làm việc tương đối chậm.

Các nhóm mà tôi tham gia muốn kiểm tra công việc của họ mỗi khi họ viết một phần tăng thêm chức năng, thường là mỗi 10-20 hướng dẫn trình lắp ráp. Trong các ngôn ngữ cấp cao hơn, bạn thường kiểm tra sau một số dòng mã tương tự, có nhiều chức năng hơn. Điều đó đánh đổi sự an toàn của HLL.

Assembler đã ngừng được sử dụng cho các tác vụ lập trình quy mô lớn vì nó cho năng suất thấp hơn và vì nó thường không di động được với các loại máy tính khác. Trong 25 năm qua, tôi đã viết khoảng 8 dòng trình hợp ngữ, và đó là tạo ra các điều kiện lỗi để kiểm tra trình xử lý lỗi.

1 postasaguest Jan 22 2021 at 23:25

Không phải khi tôi làm việc với máy tính hồi đó. Chúng tôi đã gặp nhiều vấn đề nhưng tôi chưa bao giờ gặp phải vấn đề hỏng bộ nhớ.

Bây giờ tôi đã làm việc trên một số máy IBM 7090.360.370, s / 3, s / 7 và cả 8080 và Z80 dựa trên micro. Các máy tính khác cũng có thể đã gặp vấn đề về bộ nhớ.