Để lọc những chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX từ một dãy dài các số trong một tệp .TXT, bạn có thể làm theo các bước sau:
- Đọc nội dung từ tệp .TXT.
- Sử dụng biểu thức chính quy (regular expressions) để tìm các chuỗi ký tự phù hợp.
- Lưu các chuỗi ký tự hợp lệ vào một danh sách hoặc tệp khác.
Dưới đây là một ví dụ về cách thực hiện điều này bằng Python:
import re
# Đường dẫn đến tệp .TXT
file_path = 'path_to_your_file.txt'
# Biểu thức chính quy để khớp các chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX
pattern = re.compile(r'\b\w{5}-\w{5}-\w{5}-\w{5}\b')
# Đọc nội dung từ tệp .TXT
with open(file_path, 'r') as file:
content = file.read()
# Tìm tất cả các chuỗi ký tự khớp với mẫu
matches = pattern.findall(content)
# Hiển thị các chuỗi ký tự hợp lệ
print("Các chuỗi ký tự hợp lệ là:", matches)
# Nếu muốn lưu các chuỗi hợp lệ vào một tệp khác
output_file_path = 'valid_numbers.txt'
with open(output_file_path, 'w') as output_file:
for match in matches:
output_file.write(match + '\n')
Trong mã trên:
re.compile(r'\b\w{5}-\w{5}-\w{5}-\w{5}\b')
là biểu thức chính quy để khớp các chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX. Trong đó:\b
đảm bảo rằng chuỗi khớp là một từ đầy đủ (tức là không phải là một phần của một từ dài hơn).\w{5}
khớp với 5 ký tự chữ hoặc số.-
khớp với dấu gạch ngang.file.read()
đọc toàn bộ nội dung của tệp.pattern.findall(content)
tìm tất cả các chuỗi khớp với mẫu trong nội dung của tệp.- Các chuỗi hợp lệ được lưu vào tệp
valid_numbers.txt
.
Bạn chỉ cần thay thế path_to_your_file.txt
bằng đường dẫn thực tế đến tệp .TXT của bạn.