Phương Thức splitlines() trong Python | Laptrinhcanban.com

HOME › >>

Phương Thức splitlines() trong Python

Python là một trong những ngôn ngữ lập trình phổ biến nhất, và nó cung cấp nhiều công cụ mạnh mẽ cho xử lý chuỗi và dữ liệu văn bản. Một trong những phương thức quan trọng và hữu ích cho việc xử lý dữ liệu văn bản là splitlines(). Phương thức này cho phép bạn tách dòng văn bản thành các dòng con, giúp bạn xử lý dữ liệu định dạng theo dòng một cách thông minh. Trong bài viết này, chúng ta sẽ khám phá chi tiết về phương thức splitlines() trong Python, tìm hiểu cách sử dụng nó và lý do tại sao nó quan trọng trong xử lý dữ liệu văn bản.

Giới Thiệu về Phương Thức splitlines() trong Python

Phương thức splitlines() là một phần của đối tượng chuỗi (string) trong Python. Nó được sử dụng để tách dòng văn bản thành các dòng con, và kết quả được lưu trữ trong một danh sách (list). Cú pháp cơ bản của phương thức splitlines() như sau:

chuoi.splitlines(keepends=False)

Trong đó

  • chuoi: Đây là chuỗi mà bạn muốn tách thành các dòng con.
  • keepends (tùy chọn): Đây là một giá trị boolean. Nếu keependsTrue, ký tự kết thúc dòng (thường là \n hoặc \r\n) sẽ được bao gồm trong các dòng con. Mặc định là False.

Phương thức splitlines() trả về một danh sách các dòng con đã tách.

Lưu ý các ký tự xuống dòng sẽ không được bao gồm trong danh sách kết quả trừ khi chúng ta chỉ định giá trị keepends = True

Tham khảo các ký tự trong chuỗi được coi là ký tự xuống dòng như bảng sau đây:

\n xuống dòng
\r quay về đầu dòng
\r\n xuống dòng + quay về đầu dòng
\v or \x0b Tab thẳng
\f or \x0c ngắt trang
\x1c ngắt tệp
\x1d Ngắt nhóm
\x1e Ngắt bản ghi
\x85 xuống dòng (mã điều khiển C1)
\u2028 ngắt dòng
\u2029 Phân cách đoạn văn

Sử Dụng Phương Thức splitlines() trong Python

Dưới đây là một số ví dụ về cách sử dụng phương thức splitlines() trong Python:

Phân Tách Dòng Văn Bản

chuoi = "Đây là dòng 1.\nĐây là dòng 2.\nĐây là dòng 3."
danh_sach_dong = chuoi.splitlines()
print(danh_sach_dong)

Kết quả sẽ là một danh sách chứa các dòng con:

['Đây là dòng 1.', 'Đây là dòng 2.', 'Đây là dòng 3.']

Bao Gồm Ký Tự Kết Thúc Dòng

chuoi = "Dòng 1\nDòng 2\nDòng 3"
danh_sach_dong = chuoi.splitlines(keepends=True)
print(danh_sach_dong)

Kết quả sẽ bao gồm ký tự kết thúc dòng (\n):

['Dòng 1\n', 'Dòng 2\n', 'Dòng 3']

Xử Lý Dữ Liệu Từ Tệp Tin

Phương thức splitlines() thường được sử dụng khi đọc dữ liệu từ tệp tin văn bản, nơi mỗi dòng tương ứng với một bản ghi hoặc một mục.

with open('du_lieu.txt', 'r') as file:
du_lieu = file.read()

danh_sach_dong = du_lieu.splitlines()
for dong in danh_sach_dong:
print(dong)

Trong ví dụ này, chúng ta đọc dữ liệu từ tệp tin ‘du_lieu.txt’, sau đó tách nó thành các dòng con sử dụng splitlines() và hiển thị từng dòng.

Tại Sao Phương Thức splitlines() Quan Trọng

Phương thức splitlines() trong Python quan trọng với các lý do sau:

  1. Xử Lý Dữ Liệu Từ Tệp Tin: Phương thức splitlines() là một công cụ quan trọng khi bạn đọc dữ liệu từ tệp tin văn bản. Nó giúp bạn tách dữ liệu thành các dòng con để dễ dàng xử lý.

  2. Xử Lý Dữ Liệu Dòng Một: Trong nhiều tình huống, dữ liệu văn bản được tổ chức theo dòng, và splitlines() giúp bạn xử lý dữ liệu này một cách hiệu quả dòng một.

  3. Xử Lý Dữ Liệu Văn Bản Được Chuẩn Hóa: Khi bạn làm việc với dữ liệu văn bản đã được chuẩn hóa với các dấu kết thúc dòng, splitlines() giúp bạn tách dữ liệu một cách chính xác.

  4. Xử Lý Dữ Liệu Dòng Trắng: Phương thức splitlines() giúp bạn tách dữ liệu văn bản thành các dòng con, bao gồm cả dòng trắng, để thực hiện các phân tích dữ liệu phức tạp.

Xử Lý Tình Huống Đặc Biệt

Khi sử dụng phương thức splitlines(), cần chú ý đến một số tình huống đặc biệt:

  1. Xử Lý Ký Tự Kết Thúc Dòng Đặc Biệt: Ký tự kết thúc dòng có thể thay đổi dựa trên hệ điều hành (ví dụ: \n trên Unix và \r\n trên Windows). Nếu cần xử lý dữ liệu từ nhiều nguồ

n, bạn cần kiểm tra và chuẩn hóa ký tự kết thúc dòng trước khi sử dụng splitlines().

  1. Xử Lý Dòng Trắng: Phương thức splitlines() mặc định loại bỏ các dòng trắng khỏi danh sách kết quả. Nếu bạn muốn bao gồm chúng, bạn cần sử dụng tham số keepends=True.

Kết Luận

Trên đây Kiyoshi đã hướng dẫn bạn về Phương thức splitlines trong python rồi. Đây là một công cụ quan trọng trong xử lý dữ liệu văn bản. Nó cho phép bạn tách dòng văn bản thành các dòng con và làm việc với dữ liệu dựa trên dòng một cách thông minh. Sử dụng splitlines() là một kỹ năng quan trọng cho việc đọc tệp tin, xử lý dữ liệu dòng một, và thực hiện các phân tích dữ liệu liên quan đến dòng trong lập trình Python.

URL Link

https://laptrinhcanban.com/python/nhap-mon-lap-trinh-python/thao-tac-voi-chuoi-string-trong-python/splitlines-trong-python/

Hãy chia sẻ và cùng lan tỏa kiến thức lập trình Nhật Bản tại Việt Nam!

HOME  › >>

Profile
きよしです!笑

Tác giả : Kiyoshi (Chis Thanh)

Kiyoshi là một cựu du học sinh tại Nhật Bản. Sau khi tốt nghiệp đại học Toyama năm 2017, Kiyoshi hiện đang làm BrSE tại Tokyo, Nhật Bản.