Python, một trong những ngôn ngữ lập trình phổ biến nhất trên thế giới, nổi bật với sự linh hoạt và khả năng xử lý dữ liệu mạnh mẽ. Trong việc làm việc với dữ liệu văn bản, một trong những nhiệm vụ quan trọng là đếm sự xuất hiện của một chuỗi con trong một chuỗi lớn. Python cung cấp cho chúng ta một công cụ hiệu quả để thực hiện công việc này thông qua hàm count
. Bài viết này sẽ tập trung vào việc sử dụng hàm count
trong chuỗi Python, giúp bạn hiểu rõ cách hoạt động của nó và ứng dụng trong thực tế.
Hàm count - Đếm sự xuất hiện trong chuỗi
Hàm count
trong Python được sử dụng để đếm số lần xuất hiện của một chuỗi con trong chuỗi gốc. Đây là cú pháp của hàm count
:
str.count(sub, start, end)
Trong đó sub
là chuỗi ký tự cần đếm số lần xuất hiện trong chuỗi str
. Còn start
và end
(có thể lược bỏ) dùng để chỉ định phạm vi tìm kiếm trong chuỗi str
.
Bạn có thể sử lược bỏ start
và end
để đếm số lần xuất hiện của ký tự sub
trong toàn bộ chuỗi str
, hoặc chỉ định thêm start
và end
để quyết định phạm vi tiến hành đếm trong chuỗi str
.
Kết quả trả về sẽ là số lần xuất hiện không trùng lặp của ký tự sub
chuỗi str
. Và nếu như sub
không tồn tại trong str
, phương thức count trong python sẽ trả về kết quả bằng 0.
Ví dụ minh họa:
chuoi = "Python rất mạnh mẽ, Python rất linh hoạt." |
Kết quả:
Số lần xuất hiện của 'Python' trong chuỗi là: 2 |
Hàm count
là một công cụ mạnh mẽ để đếm sự xuất hiện của một chuỗi con cụ thể trong một chuỗi lớn. Điều này có thể rất hữu ích trong nhiều tình huống, bao gồm xử lý dữ liệu văn bản, phân tích ngôn ngữ tự nhiên, và xử lý chuỗi ký tự.
Chỉ định đối số trong phương thức count
Lược bỏ đối số start và end
Khi lược bỏ đối số start
và end
khi sử dụng phương thức count trong python, python sẽ tiến hành đếm số lần xuất hiện của ký tự chỉ định trên toàn bộ chuỗi ban đầu.
str.count(sub)
Ví dụ:
print("dictionary".count("io")) |
ở ví dụ 1, ký tự io
xuất hiện 1 lần trong chuỗi dictionary
, do đó phương thức count sẽ trả về kết quả bằng 1.
ở ví dụ 2, ký tự oo
xuất hiện 2 lần trong chuỗi Good School
, do đó phương thức count sẽ trả về kết quả bằng 2.
ở ví dụ 3, ký tự oo
xuất hiện 4 lần trong chuỗi Goooood
, tuy nhiên số lần xuất hiện không trùng lặp chỉ có 2 lần, do đó phương thức count sẽ trả về kết quả bằng 2.
G o o o o o d --- --- 1 2
ở ví dụ 4, ký tự aa
không tồn tại trong chuỗi Orange
, do đó phương thức count sẽ trả về kết quả bằng 0.
Chỉ định đối số start và end
Khi bạn chỉ định giá trị của start
và end
trong đối số của phương thức count, python sẽ đếm số lần xuất hiện của ký tự sub
tại phạm vi tính từ vị trí ký tự có index bằng start
tới vị trí ký tự có index bằng end
trong chuỗi str
.
str.count(sub, start, end)
- Về index trong chuỗi python, bạn có thể tham khảo tại bài Lấy ký tự trong chuỗi python.
Cách sử dụng thực tiễn giống như ví dụ sau:
print("Good School".count("oo")) |
ở ví dụ 2, ký tự oo
xuất hiện 1 lần trong chuỗi Good School
trong phạm vi index từ 3
đến 10
, do đó phương thức count sẽ trả về kết quả bằng 1.
d S c h o o l 3 4 5 6 7 8 9 10
ở ví dụ 3, do giá trị của end
đã được rút gọn nên python sẽ tiến hành tìm kiếm cho tới ký tự cuối cùng trong chuỗi ( ký tự l
có index bằng 10
) và trả về kết quả giống ví dụ 2.
Ứng dụng của hàm count trong thực tế
Đếm từ trong văn bản
Một ứng dụng phổ biến của hàm count
là đếm số từ trong một đoạn văn bản. Bằng cách sử dụng khoảng trắng để phân tách từ, bạn có thể đếm số từ trong chuỗi văn bản dễ dàng.
Ví dụ:
van_ban = "Python là một ngôn ngữ lập trình phổ biến." |
Kết quả:
Số từ trong đoạn văn là: 6 |
Kiểm tra sự tồn tại của từ khoá
Hàm count
cũng có thể được sử dụng để kiểm tra sự tồn tại của một từ khoá trong văn bản. Nếu số lần xuất hiện của từ khoá lớn hơn 0, điều đó có nghĩa từ khoá tồn tại trong văn bản.
Ví dụ:
van_ban = "Python là một ngôn ngữ lập trình phổ biến." |
Kết quả:
Từ khoá 'Python' tồn tại trong văn bản. |
Đếm các ký tự đặc biệt
Ngoài việc đếm từ và từ khoá, bạn cũng có thể sử dụng hàm count
để đếm các ký tự đặc biệt hoặc dấu câu trong văn bản. Điều này có thể hữu ích trong việc phân tích cú pháp hoặc thực hiện kiểm tra định dạng.
Ví dụ:
van_ban = "Đây là một ví dụ về việc đếm số dấu chấm, số dấu phẩy và số dấu hỏi." |
Kết quả:
Số dấu chấm: 2 |
Điểm mạnh và hạn chế của hàm count
Điểm mạnh
Dễ sử dụng: Hàm
count
rất dễsử dụng và cú pháp của nó đơn giản. Bất kỳ người lập trình Python nào cũng có thể nắm bắt cách sử dụng nhanh chóng.
Hiệu quả: Hàm
count
hoạt động hiệu quả và nhanh chóng, giúp bạn xử lý dữ liệu văn bản một cách hiệu quả.Đa dạng trong ứng dụng: Hàm
count
có thể được sử dụng trong nhiều tình huống khác nhau, từ đếm từ, từ khoá đến các ký tự đặc biệt.
Hạn chế
Không phân biệt chữ hoa và chữ thường: Hàm
count
không phân biệt chữ hoa và chữ thường, vì vậy nếu bạn cần phân biệt chữ hoa và chữ thường, bạn cần thực hiện xử lý trước.Chỉ đếm chuỗi con liên tục: Hàm
count
chỉ đếm số lần xuất hiện của chuỗi con liên tiếp, nó không phát hiện sự xuất hiện qua nhiều phần bị ngăn cách bởi các khoảng trắng hoặc dấu câu.
Kết luận
Trên đây Kiyoshi đã hướng dẫn bạn cách về hàm count trong chuỗi python rồi. Hàm count
trong Python là một công cụ mạnh mẽ để đếm sự xuất hiện của một chuỗi con trong một chuỗi lớn. Nó có nhiều ứng dụng thực tế, từ đếm từ, từ khoá đến đếm ký tự đặc biệt trong văn bản. Sử dụng cẩn thận và sáng tạo, bạn có thể tận dụng hàm count
để giải quyết nhiều vấn đề phức tạp trong xử lý dữ liệu văn bản.
URL Link
HOME › python cơ bản - lập trình python cho người mới bắt đầu>>09. chuỗi trong python