Công nghệ

Lọc những chuỗi ký tự từ tệp

Để lọc những chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX từ một dãy dài các số trong một tệp .TXT, bạn có thể làm theo các bước sau:

  1. Đọc nội dung từ tệp .TXT.
  2. Sử dụng biểu thức chính quy (regular expressions) để tìm các chuỗi ký tự phù hợp.
  3. Lưu các chuỗi ký tự hợp lệ vào một danh sách hoặc tệp khác.

Dưới đây là một ví dụ về cách thực hiện điều này bằng Python:

import re

# Đường dẫn đến tệp .TXT
file_path = 'path_to_your_file.txt'

# Biểu thức chính quy để khớp các chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX
pattern = re.compile(r'\b\w{5}-\w{5}-\w{5}-\w{5}\b')

# Đọc nội dung từ tệp .TXT
with open(file_path, 'r') as file:
    content = file.read()

# Tìm tất cả các chuỗi ký tự khớp với mẫu
matches = pattern.findall(content)

# Hiển thị các chuỗi ký tự hợp lệ
print("Các chuỗi ký tự hợp lệ là:", matches)

# Nếu muốn lưu các chuỗi hợp lệ vào một tệp khác
output_file_path = 'valid_numbers.txt'
with open(output_file_path, 'w') as output_file:
    for match in matches:
        output_file.write(match + '\n')

Trong mã trên:

  • re.compile(r'\b\w{5}-\w{5}-\w{5}-\w{5}\b') là biểu thức chính quy để khớp các chuỗi ký tự có dạng XXXXX-XXXXX-XXXXX-XXXXX. Trong đó:
  • \b đảm bảo rằng chuỗi khớp là một từ đầy đủ (tức là không phải là một phần của một từ dài hơn).
  • \w{5} khớp với 5 ký tự chữ hoặc số.
  • - khớp với dấu gạch ngang.
  • file.read() đọc toàn bộ nội dung của tệp.
  • pattern.findall(content) tìm tất cả các chuỗi khớp với mẫu trong nội dung của tệp.
  • Các chuỗi hợp lệ được lưu vào tệp valid_numbers.txt.

Bạn chỉ cần thay thế path_to_your_file.txt bằng đường dẫn thực tế đến tệp .TXT của bạn.

Related Articles

Để lại một bình luận

Back to top button