1. CÂY NHỊ PHÂN TÌM KIẾM
Cây nhị phân tìm kiếm (CNPTK) là cây nhị phân trong đó tại mỗi
nút, khóa của nút đang xét lớn hơn khóa của tất cả các nút thuộc cây con trái và
nhỏ hơn khóa của tất cả các nút thuộc cây con phải. Dưới đây là một ví dụ về cây nhị phân tìm kiếm:
Nhờ ràng buộc về khóa trên CNPTK, việc tìm kiếm trở nên có
định hướng. Hơn nữa, do cấu trúc cây việc tìm kiếm trở nên nhanh đáng kể. Nếu số
nút trên cây là N thì chi phí tìm kiếm trung bình chỉ khoảng log2N.
Trong thực tế, khi xét đến cây nhị phân chủ yếu người ta xét
CNPTK.
2. CÁC THAO TÁC TRÊN CÂY NHỊ PHÂN TÌM KIẾM
2.1. Duyệt cây
Thao tác duyệt cây trên cây nhị phân tìm kiếm hoàn toàn giống như
trên cây nhị phân. Chỉ có một lưu ý nhỏ là khi duyệt theo thứ tự giữa, trình tự
các nút duyệt qua sẽ cho ta một dãy các nút theo thứ tự tăng dần của khóa.
2.2. Tìm một phần tử x trong cây
LPNODE searchNode(TREE
T, Data X)
{
if ( T != NULL )
{
if(T->Key == X)
return T;
else if(T->Key >
X)
return searchNode(T->pLeft, X);
else
return searchNode(T->pRight, X);
}
return NULL;
}
//Ta có
thể xây dựng một hàm tìm kiếm tương đương không đệ qui như sau:
LPTNODE
searchNode(TREE Root, Data x)
{
LPNODE p = Root;
while (p != NULL)
{
if(x == p->Key)
return p;
else if(x <
p->Key)
p = p->pLeft;
else //if(x > p->Key)
p = p->pRight;
}
return NULL;
}
Dễ dàng thấy rằng số lần so sánh tối đa phải thực hiện để tìm
phần tử X là h, với h là chiều cao của cây. Như vậy thao tác tìm kiếm trên CNPTK
có n nút tốn chi phí trung bình khoảng O(log2n) .
Ví dụ: Tìm phần tử 55

2.3. Thêm một phần tử x vào cây
Việc thêm một phần tử X vào cây phải bảo đảm điều kiện ràng
buộc của CNPTK. Ta có thể thêm vào nhiều chỗ khác nhau trên cây, nhưng nếu thêm
vào một nút lá sẽ là tiện lợi nhất do ta có thể thực hiên quá trình tương tự
thao tác tìm kiếm. Khi chấm dứt quá trình tìm kiếm cũng chính là lúc tìm được
chỗ cần thêm.
Hàm insert trả về giá trị –1, 0, 1 khi không đủ bộ nhớ, gặp
nút cũ hay thành công:
int insertNode(TREE &T, Data X)
{
if ( T != NULL )
{
if (T->Key == X)
return 0; //đã có
else if (T->Key
> X)
return insertNode(T->pLeft, X);
else
return insertNode(T->pRight, X);
}
T =
new TNode;
if (T == NULL)
return -1; //thiếu bộ
nhớ
T->Key = X;
T->pLeft = NULL;
T->pRight = NULL;
return 1; //thêm
vào thành công
}
Ví dụ: Thêm phần tử 50
2.4. Hủy một phần tử có khóa X
Việc hủy một phần tử X ra khỏi cây phải bảo đảm điều kiện ràng
buộc của CNPTK.
Có 3 trường hợp khi hủy nút X có thể xảy ra:
X
là nút lá.
X
chỉ có 1 con (trái hoặc phải).
X
có đủ cả 2 con
Trường
hợp thứ nhất: chỉ đơn giản hủy X vì nó không móc nối
đến phần tử nào khác.
Trường
hợp thứ hai: trước khi hủy X ta móc nối cha của X với
con duy nhất của nó.
Trường
hợp cuối cùng: ta không thể hủy trực tiếp do X có đủ 2 con
Þ Ta sẽ hủy gián tiếp. Thay vì hủy X, ta sẽ tìm một phần tử thế mạng Y. Phần tử
này có tối đa một con. Thông tin lưu tại Y sẽ được chuyển lên lưu tại X. Sau đó,
nút bị hủy thật sự sẽ là Y giống như 2 trường hợp đầu.
Vấn đề là phải chọn Y sao cho khi lưu Y vào vị trí của X, cây vẫn là CNPTK.
Có 2 phần tử thỏa mãn yêu cầu:
+ Phần tử nhỏ nhất (trái nhất) trên cây con phải.
+ Phần tử lớn nhất (phải nhất) trên cây con trái.
Việc chọn lựa phần tử nào là phần tử thế mạng hoàn toàn phụ
thuộc vào ý thích của người lập trình. Ở đây, cháng tôi sẽ chọn phần tử (phải
nhất trên cây con trái làm phân tử thế mạng.
Hãy xem ví dụ dưới đây để hiểu rõ hơn:
Sau khi hủy phần tử X=18 ra khỏi cây tình trạng của cây sẽ như trong hình (phần tử 23 là phần tử thế mạng)
Hàm deleteNode trả về giá trị 1, 0 khi hủy thành công hoặc không có X trong cây:
int deleteNode(TREE &T, Data X)
{
if (T == NULL)
return 0;
else if (T->Key > X)
return deleteNode (T->pLeft, X);
else if(T->Key < X)
return deleteNode (T->pRight, X);
else //T->Key == X
{
LPNODE p = T;
if (T->pLeft == NULL)
T = T->pRight;
else if
(T->pRight == NULL)
T =
T->pLeft;
else //T có cả 2 con
{
LPNODE q = T->pRight;
searchStandFor(p, q);
}
delete p;
}
}
Trong đó, hàm searchStandFor được viết như sau:
//Tìm
phần tử thế mạng cho nút p
void
searchStandFor(TREE &p, TREE &q)
{
if (q->pLeft)
searchStandFor(p, q->pLeft);
else
{
p->Key = q->Key;
p = q;
q = q->pRight;
}
}
2.5. Tạo một cây CNPTK
Ta có thể tạo một cây nhị phân tìm kiếm bằng cách lặp lại quá
trình thêm 1 phần tử vào một cây rỗng.
2.6. Hủy toàn bộ CNPTK
Việc toàn bộ cây có thể được thực hiện thông qua thao tác
duyệt cây theo thứ tự sau. Nghĩa là ta sẽ hủy cây con trái, cây con phải rồi mới
hủy nút gốc.
void
removeTree(TREE &T)
{
if ( T != NULL )
{
removeTree(T->pLeft);
removeTree(T->pRight);
delete T;
}
}
3. ĐÁNH GIÁ
Tất cả các thao tác searchNode, insertNode, deleteNode trên
CNPTK đều có độ phức tạp trung bình O(h), với h là chiều cao của cây.
Trong trong trường hợp tốt nhất, CNPTK có n nút sẽ có độ cao h
= log2(n). Chi phí tìm kiếm khi đó sẽ tương đương tìm kiếm nhị phân
trên mảng có thứ tự. Tuy nhiên, trong trường hợp xấu nhất, cây có thể bị suy biến
thành 1 DSLK (khi mà mỗi nút đều chỉ có 1 con trừ nút lá). Lúc đó các thao tác
trên sẽ có độ phức tạp O(n). Vì vậy cần có cải tiến cấu trúc của CNPTK để đạt
được chi phí cho các thao tác là log2(n).