Video: Không Phải Cứ Vẩy Tay Nhiều Là Tốt, Đây Mới Là Cách Vẩy Tay Thổi Bay Bệnh Tật 2025
R hỗ trợ khái niệm các biểu thức chính quy, cho phép bạn tìm kiếm các mẫu bên trong văn bản. Bạn có thể không bao giờ nghe thấy những biểu hiện thông thường, nhưng có lẽ bạn đã quen với khái niệm rộng. Nếu bạn đã bao giờ sử dụng một * hoặc một? để chỉ bất kỳ chữ cái nào trong một từ, sau đó bạn đã sử dụng một dạng tìm kiếm ký tự đại diện. Biểu thức thông thường hỗ trợ ý tưởng về các ký tự đại diện và nhiều hơn nữa.
Biểu thức chính quy cho phép ba cách để tạo một mẫu tìm kiếm chung chung hơn một biểu thức duy nhất, cố định:
-
Các lựa chọn thay thế: Bạn có thể tìm kiếm trường hợp của một mẫu hoặc dạng khác, được chỉ định bởi | ký hiệu. Ví dụ bãi biển | cây sồi phù hợp với bãi biển và sồi.
Trên bàn phím tiếng Anh và tiếng Hoa Mỹ, bạn thường có thể tìm thấy | trên cùng một phím như dấu gạch chéo ngược () ngược lại ().
-
Nhóm: Bạn nhóm các mẫu với nhau bằng cách sử dụng dấu ngoặc đơn (). Ví dụ bạn viết be (a | e) ch để tìm cả beach và beech.
Định lượng: -
Bạn xác định xem một phần tử trong mẫu có phải được lặp lại hay không bằng cách thêm * (xảy ra không hoặc nhiều lần) hoặc + (xảy ra một lần hoặc nhiều lần). Ví dụ, để tìm bach hoặc beech (từ 0 trở lên và e nhưng không cả hai), bạn sử dụng b (e * | a *) ch. Thử ví dụ sau đây Đầu tiên, tạo một biến mới với năm từ: >> rwords <- c ("bach", "back", "beech", "beach", "black") Tìm cả bãi biển > hoặc
beech
bằng cách sử dụng sự kết hợp khác:
nhưng không
bãi biển:
rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "beech" > Để tìm thêm trợ giúp về R về các biểu thức chính quy, hãy xem trang Trợ giúp? regexp. Một số tài nguyên tuyệt vời khác để tìm hiểu thêm về các biểu thức chính quy là Wikipedia và nơi bạn có thể tìm thấy hướng dẫn bắt đầu nhanh và các hướng dẫn.