Dài lâu trong c99
Trong tiêu chuẩn C99 mà họ đã giới thiệu long long
. mục đích của việc này là gì? Trong kinh nghiệm lập trình C (hạn chế) của tôi, tôi chỉ từng thấy một int 4 byte và một dài 8 byte. Ví dụ, từ Trình khám phá trình biên dịch:
Nếu long
đã có 8
thì tại sao lại cần thêm long long
loại khác ? Điều này làm gì với trình biên dịch / kiến trúc?
Trả lời
Nếu long đã là 8 rồi thì tại sao phải thêm một loại long dài nữa? Điều này làm gì với trình biên dịch / kiến trúc?
"Nếu độ dài đã là 8" không phải lúc nào cũng đúng vì có nhiều mã tồn tại dựa trên 32-bit long
và int
32 hoặc 16 bit.
Yêu cầu long
64-bit sẽ phá vỡ các cơ sở mã. Đây là một mối quan tâm lớn.
Tuy nhiên, yêu cầu long
duy trì 32-bit (và không long long
) sẽ không tạo ra quyền truy cập vào các số nguyên 64-bit tiêu chuẩn, do đó là lý do cho long long
.
Cho phép long
32-bit hoặc 64-bit (hoặc những thứ khác) cho phép chuyển đổi.
Các chức năng khác nhau chuyển vào / trả lại long
như thế nào fseek(), ftell()
. Chúng được hưởng lợi từ long
việc hỗ trợ tệp lớn hơn 32-bit.
Phương pháp được khuyến nghị khuyến khích rộng hơn long
: "Các loại được sử dụng size_t
và ptrdiff_t
không nên có xếp hạng chuyển đổi số nguyên lớn hơn signed long int
trừ khi việc triển khai hỗ trợ các đối tượng đủ lớn để làm cho điều này trở nên cần thiết." Điều này liên quan đến kích thước bộ nhớ vượt quá 32-bit.
Có lẽ trong tương lai một triển khai có thể sử dụng int/long/long long/intmax_t
như 32/64/128/256 bit.
IAC, tôi thấy các loại chiều rộng cố định intN_t
ngày càng phổ biến hơn long
và long long
. Tôi có xu hướng sử dụng các loại cố định chiều rộng hoặc bool
, ( unsigned
) char
, int
/ unsigned
, size_t
, ( u
) intmax_t
và nghỉ signed char
, ( unsigned
) short
, ( unsigned
) long
, ( unsigned
) long long
đối với trường hợp đặc biệt.
Tiêu chuẩn C chỉ đảm bảo rằng một int
có thể là (nói một cách dễ hiểu) 2 byte, a long
có thể là 4 byte và a long long
có thể là 8 byte.
Trên thực tế, MSVC vẫn sử dụng 4 byte long
mặc dù nó có 4 byte int
.
Yêu cầu có liên quan duy nhất cho int
và long
, sau đó và bây giờ, là int
phải có ít nhất 16 bit và long
phải có ít nhất 32 bit. Các hệ thống 16 và 32-bit đều có xu hướng có 32-bit long
và máy 64-bit ít phổ biến hơn nhiều vào cuối những năm 1990. Vì vậy, trước C99, các lập trình viên không thể dựa vào việc có sẵn kiểu số nguyên 64-bit. Vấn đề đó đã được giải quyết bằng cách giới thiệu long long
, được yêu cầu ít nhất là 64 bit. (Tôi tin rằng nó đã được cung cấp bởi GCC và có thể các trình biên dịch khác như một phần mở rộng).
Ngày nay, nhiều (nhưng không phải tất cả) hệ thống 64-bit sử dụng 64-bit long
và không bận tâm đến việc làm long long
lớn hơn nữa, vì vậy nó cũng là 64-bit và theo một nghĩa nào đó là dư thừa. Đó có lẽ là những hệ thống mà bạn đã quen thuộc, nhưng chúng không đại diện cho mọi thứ ngoài kia.
Tôi nghĩ rằng bạn đã không nhận ra rằng bạn đang đặt ra một giả định sai lầm rất lớn về cách hoạt động của các yêu cầu về độ rộng loại C: ISO C chỉ đặt một dải giá trị tối thiểu như độ lớn nhỏ nhất được phép LONG_MAX
và LONG_MIN
(-2147483647, không phải 8 vì ISO C cho phép phần bù và số nguyên có dấu / độ lớn của một người, không chỉ phần bù của 2.) Việc triển khai thực tế được phép có nhiều kiểu hơn, thường để khớp với chiều rộng thanh ghi hoặc kích thước toán hạng mà máy đích có thể thực hiện một cách hiệu quả.
Phần lớn đã được viết về điều này trên Stack Overflow và các nơi khác, mà tôi sẽ không cố gắng lặp lại ở đây. Xem thêmhttps://en.cppreference.com/w/c/language/arithmetic_types
Điều đó khiến bạn mắc phải sai lầm khi xem xét các lựa chọn chiều rộng kiểu trong Hệ thống x86-64 V ABI và giả sử rằng các triển khai C khác cũng giống nhau, tôi nghĩ vậy. x86-64 là ISA 64-bit có thể hoạt động hiệu quả với các số nguyên 64-bit, vì vậy 64-bit long
là một lựa chọn khá hợp lý.
Không có ABI lành mạnh cho một máy 32-bit như i386 sẽ sử dụng 64-bit long
vì điều đó không bắt buộc, chỉ 32-bit. Sử dụng 64-bit có nghĩa là nó không thể phù hợp với một thanh ghi duy nhất. Biên dịch với -m32
hoặc biên dịch cho ARM 32-bit. Godbolt cũng có GCC cho AVR và MSP430. Trên các máy 8 bit và 16 bit đó, GCC chọn độ rộng nhỏ nhất được ISO C cho phép (2 byte int
, v.v.)
Vào năm 1999, x86-64 thậm chí còn không tồn tại. (Một số ISA 64-bit khác đã làm như Alpha). Vì vậy, nhìn vào một trong 2 ABI chính để hiểu được sự lựa chọn C99 sẽ không giúp bạn đi quá xa.
Tất nhiên C cần một kiểu được đảm bảo ít nhất là 64-bit, để cho phép mọi người viết các chương trình thực hiện phép toán số nguyên 64-bit một cách hiệu quả.
Và BTW, x86-64 có thể thực hiện nội dung số nguyên 32-bit hiệu quả như 64-bit, đôi khi hiệu quả hơn. Vì vậy, việc tạo ra long
loại 64-bit được cho là không tốt. Một số mã sử dụng long
vì họ muốn một loại cần phải là 32-bit, nhưng không được lợi khi có nó rộng hơn. Đối với mã như vậy, 64-bit long
chỉ lãng phí dấu chân bộ nhớ cache / băng thông bộ nhớ và kích thước mã (tiền tố REX). Ở C99, lựa chọn lý tưởng sẽ là int_least32_t
, nhưng điều đó gây khó chịu khi gõ và hiếm khi được sử dụng.
Nhưng OTOH, long
đôi khi được hy vọng là "loại (1-thanh ghi) hiệu quả nhất", mặc dù không có gì đảm bảo như vậy và LLP64 ABI như Windows x64 với 32-bit long
thì không như vậy.
Một nguyên nhân khác int_fast32_t
là IMO của C99 và x86-64 System V là sự lựa chọn tồi để biến nó thành loại 64-bit. (Tôi có một câu trả lời nửa văn bản cho Cpp uint32_fast_t giải quyết thành uint64_t nhưng chậm hơn đối với hầu hết các hoạt động so với uint32_t (x86_64). Tại sao nó phân giải thành uint64_t? Tôi nên kết thúc ... int_fast32_t
đặt ra câu hỏi "nhanh để làm gì mục đích ", và trên nhiều cách triển khai, đó không phải là điều bạn hy vọng trong nhiều trường hợp.
Xem thêm
- C ++ - kiểu số nguyên nhanh nhất?
- Loại [u] int_fastN_t nên được định nghĩa như thế nào cho x86_64, có hoặc không có ABI x32?
- Tại sao uint32_t lại được ưu tiên hơn là uint_fast32_t?
- Tại sao uint_least16_t nhanh hơn uint_fast16_t cho phép nhân trong x86_64?
- Tối ưu hóa trình biên dịch được phép thông qua các loại chiều rộng không cố định "int", "ít nhất" và "nhanh" C / C ++
Có một số giới hạn nhưng tác giả trình biên dịch có thể tự do chọn độ dài cho các kiểu biến C tiêu chuẩn (char, short, int, long, long long). Đương nhiên char sẽ là một byte cho kiến trúc đó (hầu hết với trình biên dịch C là 8 bit). Và tự nhiên bạn không thể có một cái gì đó nhỏ hơn lớn hơn một cái gì đó lớn hơn, long không thể nhỏ hơn một int. Nhưng chắc chắn vào năm 1999, chúng ta đã thấy sự chuyển đổi x86 từ 16 sang 32 bit và ví dụ int đã thay đổi từ 16 thành 32 bằng một số công cụ nhưng vẫn tồn tại lâu 32. Sau đó, quá trình chuyển đổi x86 32 sang 64 bit đã xảy ra và tùy thuộc vào công cụ mà có các loại giúp đỡ.
Vấn đề đã tồn tại từ rất lâu trước đó và giải pháp không phải là cố định độ dài của các kiểu, chúng nằm trong quy tắc, tùy thuộc vào các tác giả trình biên dịch về kích thước. Nhưng các tác giả trình biên dịch cần tạo ra một tệp stdint.h phù hợp với công cụ và mục tiêu (stdint.h dành riêng cho một công cụ và mục tiêu ở mức tối thiểu và có thể là phiên bản của công cụ và các tùy chọn xây dựng cho công cụ đó, v.v.). Vì vậy, ví dụ, uint32_t luôn là 32 bit. Một số tác giả sẽ chuyển đổi nó thành một int của những người khác trong một thời gian dài, v.v. trong stdint.h của họ. Các kiểu biến ngôn ngữ C vẫn bị giới hạn ở char, short, int, v.v. cho mỗi ngôn ngữ (uint32_t không phải là kiểu biến, nó được chuyển đổi thành kiểu biến thông qua stdint.h). Giải pháp / cách giải quyết này là một cách để tránh mọi thứ trở nên điên rồ và giữ cho ngôn ngữ tồn tại.
Các tác giả thường sẽ chọn ví dụ nếu GPR là 16 bit thì int là 16 bit và nếu 32 bit là 32 bit, v.v., nhưng họ có một số quyền tự do.
Có, điều này đặc biệt có nghĩa là không có lý do gì để giả định rằng bất kỳ hai công cụ nào cho một mục tiêu cụ thể (chẳng hạn như máy tính bạn đang đọc) sử dụng các định nghĩa giống nhau cho int và long nói riêng, và nếu bạn muốn viết mã cho nền tảng này có thể chuyển qua các công cụ này (hỗ trợ nền tảng này) sau đó sử dụng các loại stdint.h chứ không phải int, long, v.v. Chắc chắn nhất nếu bạn đang sử dụng các nền tảng msp430 mcu, arm mcu, arm linux machine , một máy dựa trên x86, mà các loại, ngay cả đối với cùng một "chuỗi công cụ" (ví dụ: gnu gcc và binutils), không có cùng định nghĩa cho int và long, v.v. char và short có xu hướng là 8 và 16 bit, int và long có xu hướng khác nhau nhiều nhất, đôi khi cùng kích thước với nhau đôi khi khác nhau, nhưng điểm mấu chốt là không giả định.
Việc phát hiện các kích thước, đối với phiên bản trình biên dịch / mục tiêu / tùy chọn dòng lệnh, hoặc chỉ cần đi theo lộ trình stdint để giảm thiểu các vấn đề sau này là điều không cần thiết.