Video: Bài tập C - Chuẩn hóa xâu kí tự 2025
Tất cả mọi thứ trong máy tính được đại diện bởi một mẫu của những người và số không - các biến thể về điện áp được hiểu là số. Do đó mô hình bit 0000 0001 là số 1 khi được giải thích như một số nguyên. Tuy nhiên, mô hình bit giống nhau có nghĩa là một cái gì đó hoàn toàn khác biệt khi được giải thích như một chỉ dẫn của bộ vi xử lý.
Vì vậy, nên không có gì ngạc nhiên khi máy tính mã hóa các ký tự của bảng chữ cái bằng cách gán cho mỗi một số.
Xem nhân vật 'A'. Bạn có thể chỉ định nó bất kỳ giá trị nào bạn muốn miễn là chúng ta đều đồng ý về giá trị. Ví dụ: bạn có thể chỉ định giá trị 1 cho 'A', nếu bạn muốn. Về mặt logic, sau đó bạn có thể chỉ định giá trị 2 cho 'B', 3 đến 'C', v.v.
Trong chương trình này, 'Z' sẽ nhận được giá trị 26. Sau đó bạn có thể bắt đầu lại bằng cách gán giá trị 27 là 'a', 28 to 'b', đúng là 52 cho 'z'. Vẫn còn các chữ số '0' đến '9' cộng với tất cả các ký hiệu đặc biệt như không gian, khoảng thời gian, dấu phẩy, dấu gạch chéo, dấu chấm phẩy, và các ký tự hài hước mà bạn nhìn thấy khi nhấn phím số trong khi giữ phím Shift.
Thêm vào đó các ký tự không in được như tab và dòng mới. Khi tất cả được nói và làm xong, bạn có thể mã hóa toàn bộ bàn phím tiếng Anh bằng cách sử dụng các số giữa 1 và 127.
Khoảng năm 1963, có một thỏa thuận chung về cách các ký tự được mã hoá bằng tiếng Anh. Mã hoá ký tự ASCII (American Standard Coding for Information Interchange) thể hiện trong được áp dụng khá phổ biến, ngoại trừ một công ty.
Giá trịGiá trị | Char | 0 | NULL |
---|---|---|---|
64 | @ | 1 | Bắt đầu Tiêu đề < |
2 | Bắt đầu văn bản | 66 | |
B | 3 | Kết thúc văn bản | 67 |
C | 4 | Kết thúc truyền | 68 |
D | 5 | Yêu cầu | 69 |
E | 6 | Xác nhận | 70 |
F | 7 | Chuông | 71 |
G | 8 | Backspace | 72 |
H | 9 | Tab | 73 |
I | 10 | 74 | J |
11 | Tab dọc | 75 | K |
12 | Trang mới; Biểu mẫu Nguồn cấp dữ liệu | 76 | L |
13 | Vận chuyển Quay trở lại | 77 | M |
14 | Hết thời gian | 78 | N |
15 > Shift | 79 | O | 16 |
Thoát khỏi luồng dữ liệu | 80 | P | 17 |
Kiểm soát thiết bị 1 | 81 | Q | |
Kiểm soát thiết bị 2 82 | R | 19 | Kiểm soát thiết bị 3 |
83 | S | 20 | Điều khiển thiết bị 4 |
84 | T | 21 | Phủ định Xác nhận |
85 | U | 22 | Đồng bộ Idle |
86 | V | 23 | Kết thúc quá trình truyền |
87 < | Y | 26 | Thay thế |
90 | Tr 91 | [ | |
28 | Tệp Tệp | 92 | 29 |
Nhóm Phân cách | 93 | ] < Dấu phân tách | 94 |
^ | 31 | Đơn vị Phân định Đơn vị | 95 |
_ | 32 | Không gian | 96 |
'< 33 | ! | 97 | |
a | 34 | " | 98 |
b | 35 | # | 99 |
c | 36 | $ > 100 | d |
37 | % | 101 | e |
38 | & | 102 | f |
39 | ' | 103 | g |
40 | (> 9 41 < > | 43 | + |
107 | k | 44 | , |
108 | l | 45 | = |
109 | m | 46 | . |
110 | n | 47 | / |
111 | o | 48 | 0 |
112 | 49 | 1 > 113 | |
q | 50 | 2 | 114 |
r | 51 | 3 | 115 |
s | 52 | 4 | 116 |
t | 53 | 5 | 117 |
u | 54 | 6 | 118 |
v | 55 | 7 | 119 > |
56 | 8 | 120 | x |
57 | 9 | 121 | y |
58 | : | 122 | z |
59 | ; | 123 | ( |
60 | 124 | ||
61 | = | 125 | ) |
62 >> > 126 | ~ | 63 | ? |
127 | DEL | Điều đầu tiên bạn nhận thấy là 32 ký tự đầu tiên là các ký tự "không thể in được". Điều đó không có nghĩa là những nhân vật này quá ngây ngô đến nỗi việc kiểm duyệt không cho phép họ in ra - có nghĩa là chúng không xuất hiện dưới dạng các biểu tượng hiển thị khi in trên máy in (hoặc trên bảng điều khiển). Nhiều trong số các nhân vật này không còn được sử dụng hoặc chỉ được sử dụng theo những cách mờ nhạt. | Chẳng hạn, ký tự 25 "End of Medium" có thể được in như là ký tự cuối cùng trước khi cuộn băng từ. Đó là một hợp đồng lớn vào năm 1963, nhưng ngày nay … không nhiều, vì vậy việc sử dụng nhân vật có giới hạn. |
Các ký tự bắt đầu bằng 32 có thể in được với ngoại lệ là cuối cùng, 127, là ký tự Xóa. |