Lấy chuỗi con trong Python | Laptrinhcanban.com

HOME › >>

Lấy chuỗi con trong Python

Lấy chuỗi con (substring) trong Python là một phần quan trọng của việc xử lý và trích xuất thông tin từ chuỗi văn bản. Chuỗi con là một phần của chuỗi gốc, được tạo ra bằng cách chọn một phạm vi cụ thể của chuỗi hoặc bằng cách tìm kiếm và trích xuất một chuỗi con dựa trên một mẫu. Trong bài viết này, chúng ta sẽ tìm hiểu cách lấy chuỗi con trong Python, cùng với các ví dụ và trường hợp sử dụng phổ biến.

Sử dụng cắt chuỗi (String Slicing)

Cắt chuỗi là cách thường dùng để lấy chuỗi con trong Python. Bạn có thể sử dụng phạm vi chỉ mục (index range) để xác định phần của chuỗi mà bạn muốn trích xuất. Cú pháp của cắt chuỗi là string[start:stop], trong đó start là chỉ mục bắt đầu và stop là chỉ mục kết thúc (lưu ý rằng chỉ mục stop không bao gồm).

text = "Python Programming"
substring = text[7:18] # Lấy chuỗi con từ chỉ mục 7 đến 17 (bắt đầu từ 'P' đến 'g')

Ngoài ra, bạn có thể bỏ trống start hoặc stop để lấy toàn bộ chuỗi hoặc một phần từ đầu hoặc cuối chuỗi:

text = "Python Programming"
start_to_end = text[:] # Lấy toàn bộ chuỗi
from_start = text[:6] # Lấy từ đầu đến chỉ mục 6 (bắt đầu đến 'P')
to_end = text[7:] # Lấy từ chỉ mục 7 đến cuối chuỗi (từ 'P' đến cuối)

Sử dụng phương thức str.find() và str.index()

Phương thức str.find(substring) cho phép bạn tìm kiếm một chuỗi con trong chuỗi gốc và trả về chỉ mục đầu tiên nơi chuỗi con được tìm thấy. Nếu chuỗi con không tồn tại trong chuỗi gốc, phương thức find() sẽ trả về -1.

text = "Python Programming is fun"
index = text.find("Programming") # Trả về chỉ mục đầu tiên của "Programming" trong chuỗi

Tương tự, phương thức str.index(substring) hoạt động giống như find(), nhưng nếu chuỗi con không tồn tại, nó sẽ gây ra một lỗi.

Sử dụng phương thức str.split()

Phương thức str.split(separator) cho phép bạn chia chuỗi thành một danh sách các chuỗi con bằng cách sử dụng dấu phân cách (separator) như dấu cách, dấu phẩy hoặc bất kỳ ký tự nào khác làm dấu tách. Điều này rất hữu ích khi bạn muốn tách các từ trong một câu hoặc phân tách các giá trị trong một chuỗi ngăn cách bởi dấu phẩy.

text = "apple,banana,cherry"
fruits = text.split(",") # Tách chuỗi thành danh sách các loại trái cây

Sử dụng phương thức str.partition()

Phương thức str.partition(separator) cho phép bạn tìm kiếm một chuỗi con và chia chuỗi thành ba phần: phần trước chuỗi con, chuỗi con chính, và phần sau chuỗi con. Nó trả về một tuple chứa ba chuỗi con này.

text = "Python is easy to learn"
partitioned = text.partition("is") # Chia chuỗi thành ba phần: ("Python ", "is", " easy to learn")

Sử dụng phương thức str.rfind() và str.rindex()

Tương tự như str.find()str.index(), các phương thức str.rfind()str.rindex() tìm kiếm chuỗi con từ cuối chuỗi và trả về chỉ mục cuối cùng nơi chuỗi con được tìm thấy.

text = "Python is easy to learn, Python is fun"
r_index = text.rfind("Python") # Tìm Python cuối cùng trong chuỗi

Sử dụng biểu thức chính quy (Regular Expressions)

Biểu thức chính quy (regex) là một công cụ mạnh mẽ cho việc tìm kiếm và trích xuất các chuỗi con dựa trên mẫu cụ thể. Python cung cấp thư viện re để làm việc với regex.

import re

text = "My email is [email protected]"
match = re.search(r'\S+@\S+', text) # Tìm kiếm một địa chỉ email trong chuỗi
if match:
email = match.group()

Kết hợp cách lấy chuỗi con

Trong một số trường hợp, bạn có thể cần kết hợp một số cách lấy chuỗi con để trích xuất thông tin từ chuỗi phức tạp hơn. Ví dụ, bạn có thể tìm một chuỗi con bằng str.find() sau đó cắt chuỗi con đó bằng cắt chuỗi. Điều này cho phép bạn thực hiện một loạt các thao tác trên chuỗi.

text = "My email is [email protected]"
start_index =

text.find("is") # Tìm vị trí "is"
if start_index != -1:
start_index += 3 # Bắt đầu từ vị trí sau "is"
email = text[start_index:] # Lấy phần sau "is"

Kết luận

Trên đây Kiyoshi đã hướng dẫn bạn về lấy chuỗi con trong python rồi. Lấy chuỗi con trong Python là một phần quan trọng của việc xử lý và trích xuất thông tin từ chuỗi văn bản. Python cung cấp nhiều cách khác nhau để thực hiện điều này, bao gồm cắt chuỗi, tìm kiếm, sử dụng phương thức split(), partition(), biểu thức chính quy và kết hợp các cách lấy chuỗi con. Hiểu cách sử dụng các phương pháp này có thể giúp bạn xử lý và trích xuất thông tin từ chuỗi một cách hiệu quả trong các ứng dụng Python của bạn.

URL Link

https://laptrinhcanban.com/python/nhap-mon-lap-trinh-python/thao-tac-voi-chuoi-string-trong-python/lay-chuoi-con-trong-python/

Hãy chia sẻ và cùng lan tỏa kiến thức lập trình Nhật Bản tại Việt Nam!

HOME  › >>

Profile
きよしです!笑

Tác giả : Kiyoshi (Chis Thanh)

Kiyoshi là một cựu du học sinh tại Nhật Bản. Sau khi tốt nghiệp đại học Toyama năm 2017, Kiyoshi hiện đang làm BrSE tại Tokyo, Nhật Bản.