Phạm vi bài viết không đề cập đến các công cụ tìm kiếm tiếng Việt hiện tại, các công cụ tìm kiếm cùng thời của thế giới và chỉ mang tính giới thiệu các SE này. Bài viết không đánh giá về mặt kỹ thuật các SE này do không có nhiều thông tin nhưng SE Blog đã cố gắng tìm tất cả các thông tin lý thú về các SE này, nếu có thông tin nhầm lẫn hay cần bổ sung xin vui lòng comment để sửa.

PanVietnam.com

Tác giả của PanVietnam Search Engine là Nguyễn Thế Vinh (1976), Hoàng Thanh Tùng (1978) và Lê Hồng (1978) thuộc Công ty NetNam, Viện Công nghệ thông tin. Được nghiên cứu và phát triển trong một thời gian khá dài, hệ thống NetNam Search Engine v1.0 được đưa vào phục vụ từ cuối năm 2000 đã được rất nhiều người sử dụng mạng thời đó quan tâm. NetNam SE được nâng cấp lên phiên bản v2.0 vào 05/9/2001 và được tiếp tục nâng cấp lên phiên bản v3.0 beta vào 07/11/2001. Sau gần 2 tháng thử nghiệm, phiên bản v3.0 được chính thức giới thiệu vào ngày 1/1/2002. Năm 2003 PanVietNam được trao Giải thưởng Khoa học Kỹ thuật Thanh niên lần thứ 13, đây là giải thưởng Khoa học Kỹ thuật uy tín vào thời điểm đó.

Điểm lại một số thông tin báo chí giới thiệu và chính từ PanVietnam thì: “Như những công cụ tìm kiếm tiếng Việt bấy giờ, hệ thống này hỗ trợ tiếng Việt với ba bộ mã chính: Unicode, TCVN và VNI. Nó cũng được trang bị những công nghệ mới nhất trong tìm kiếm thông tin gồm các giải thuật lập chỉ mục cơ sở dữ liệu, xử lý song song, lọc bỏ tạp nhiễu và trùng lặp, cơ chế trả lời kết quả thông minh. Số lượng tài liệu được tìm kiếm không hạn chế. Hệ thống được chia thành ba tầng chính, gồm tầng: thu thập thông tin, nhận dạng và chuyển đổi thông tin thành dạng text, lập cơ sở dữ liệu cho các thông tin text. Mỗi tầng được chia thành nhiều đơn vị độc lập, hoạt động theo kiểu chia sẻ tính toán hoặc dự trữ (redundant). Vì vậy, nó cũng thực hiện cung cấp dịch vụ tìm kiếm cho từng website tùy theo yêu cầu cụ thể.” (trích dẫn từ Vietnamnet)

Với việc đánh chỉ mục hơn 2000 Website và hơn 15 triệu vào thời đó, PanVietnam phần nào thoả mãn được nhu cầu tìm kiếm của người dùng và là một hiện tượng về Công cụ tìm kiếm khi mà Google chưa xử lý được triệt để về tiếng Việt.

Hiện tại PanVietnam vẫn tồn tại tại địa chỉ www.panvn.com vì tên miền PanVietnam.com đã bị hack mất nhưng những gì mà người dùng có thể thấy là một giao diện Hitech với thiết kế đã cũ, Slogan “Stop Searching, Start Finding!” khá ấn tượng và chức năng tìm kiếm – chức năng chính không hoạt động!!!

Hoatieu.com

Đã từng là một hiện tượng và thần tượng của nhiều người sử dụng Internet thời bấy giờ với việc tìm kiếm khá hiệu quả cho dù ra mắt sau Vinaseek và PanVietnam, Hoatieu.com là sản phẩm của Vương Quang Khải (1979). Lý do ra đời Hoatieu.com theo Vương Quang Khải đó là ''Hiện nay đã có một lượng Web tiếng Việt khá lớn đang đưa lên mạng Internet. Nhưng khai thác những thông tin này vẫn gặp rất nhiều khó khăn. Đó là vì những máy tìm kiếm chuẩn của nước ngoài hiện nay như Google hay Altavista không hỗ trợ việc tìm kiếm tiếng Việt. Ngoài ra, tiếng Việt được lưu trữ dưới nhiều bảng mã khác nhau (Unicode, TCVN3, VNI, VIQR...) khiến cho việc tìm kiếm càng trở nên phức tạp. Người sử dụng phải tiến hành tìm nhiều lần, mỗi lần với một bảng mã tiếng Việt khác nhau để thu được những kết quả có thể'. Đó là lý do tôi ngồi viết hoatieu.com. Một máy tìm kiếm cho riêng người Việt.” (trích dẫn từ báo Lao động ngày 19/12/2002).

Tưởng chừng sự phát triển của Hoatieu.com sẽ là một thành công vì sự đầu tư và định hướng khá bài bản vì tuy ra đời sau các trang tìm kiếm như Vinaseek của Tinh Vân và Panvietnam của Viện CNTT, hoatieu.com có ưu điểm hơn là hỗ trợ tìm kiếm cả với hình ảnh và tin tức. Vào thời đó tính năng này mới chỉ có duy nhất với Google.com và theo dự định, Hoatieu.com sẽ còn tiếp tục phát triển thêm các tính năng như tìm kiếm âm nhạc MP3 theo tên bài hát, lời bài hát, tên ca sĩ, hỗ trợ các yêu cầu tìm kiếm tiếng Nhật và Trung. Thế nhưng sau 10 tháng hoạt động cuối tháng 8/2002 Hoatieu.com đã lặng lẹ cáo lui mà theo giải thích của Vương Quang Khải hồi đó thì "cấu hình máy chủ do FPT không còn đáp ứng đủ số lượng truy cập, Hoatieu.com đang tìm kiếm đối tác khác và hy vọng sớm đáp ứng trở lại nhu cầu khai thác thông tin...".

Hiện tại tên miền Hoatieu.com không còn và đang được rao bán nhưng Vương Quang Khải vẫn đang tiếp tục cho đam mê còn dang dở, vẫn là tiếp tục phát triển Công cụ tìm kiếm và xử lý tiếng Việt triệt để và hiện tại anh là người đang đứng đằng sau Zing Search với vai trò là trưởng dự án.

Vinaseek.com

Đầu tiên, sống “dai và lâu” nhất trong số các Công cụ tìm kiếm tiếng Việt đầu tiên của Việt Nam là Vinaseek của Tinh Vân. Theo như bài phỏng vấn ông Hoàng Tô, chủ tịch Hội đồng quản trị Tinh Vân Group thì: “Vinaseek ra đời cách đây khá lâu, hơn 10 năm. Khi đó Tinh Vân tham gia xây dựng hệ thống mạng của Ban chuyên đề quốc gia về công nghệ thông tin, là mạng Intranet đầu tiên ở Việt Nam có kết nối đến tất cả các tỉnh, thành. Chúng tôi đã nhận thấy nhu cầu tìm kiếm thông tin tiếng Việt là rất lớn. Hồi đó, các bảng mã tiếng Việt chưa thống nhất, có tới 20 bảng mã khác nhau cùng tồn tại, và các search engine (công cụ tìm kiếm) khi đó như Altavista hay Yahoo không hỗ trợ mã tiếng Việt. Tinh Vân phát triển cộng cụ tìm kiếm tiếng Việt đầu tiên (khi đó mang tên VIS) và đến năm 2000 thì Vinaseek ra đời, phục vụ miễn phí trên Internet. Đây là công cụ tìm kiếm tiếng Việt mạnh nhất lúc bấy giờ (sau đó có thêm panvietnam.com và hoatieu.com). Vinaseek đã gây được một tiếng vang lớn, có số lượng người sử dụng kỷ lục. Sau đó theo xu thế chung, hầu hết các trang web tiếng Việt tuân thủ mã Unicode và Google đã hỗ trợ tốt bảng mã quốc tế này. Do đó Vinaseek không thể hiện được sức mạnh và phải nhường chỗ cho Google Việt Nam. Vinaseek vẫn tồn tại nhưng số người sử dụng nó không nhiều, chủ yếu là những khách hàng quen và muốn tìm kiếm sâu hơn vào các nhánh của trang web (vì Google tìm kiếm khá nông).” (Theo TTXVN)

Theo như giới thiệu tính năng của Vinaseek vào thời đó thì:

“Hoàn toàn theo mô hình của các search engine nổi tiếng như Google, Altavista hay Yahoo, Vinaseek được bổ sung thêm khả năng tìm kiếm chính xác tiếng Việt, theo mọi bảng mã (TCVN3, VNI, TVCN-6909, VIQR...), theo mọi định dạng tài liệu văn bản (HTML, XML, RTF, WORD, PDF, PostScript...), theo mọi cách bỏ dấu khác nhau (“hoà” hay “hòa”). Vinaseek hỗ trợ tìm kiếm hình ảnh và âm thanh, hỗ trợ tìm kiếm gần đúng, tìm kiếm mờ (fuzzy search), tìm kiếm đồng âm và đồng nghĩa... Hiện Vinaseek đang lưu trữ chỉ mục và toàn văn của tất cả các trang Web tiếng Việt trên Internet (ước chừng 10 triệu văn bản) và nhận được hàng trăm ngàn lượt truy cập mỗi ngày.” (Theo Website www.Tinhvan.com)

Trong vòng 3 năm liên tục 2003 - 2005 Vinaseek được trao Cúp vàng Sản phẩm CNTT tại Tuần lễ Tin học lần thứ 11, 12, 13 cho lĩnh vực "Trang Web xuất sắc nhất" do Hội Tin học Việt Nam VAIP trao tặng.

Hiện tại tên miền Vinaseek.com thật may không bị chiếm mất như PanVietnam.com hay Hoatieu.com nhưng khi truy cập vào địa chỉ này thì nó được link thẳng đến http://xalo.vn/ một công cụ tìm kiếm mà theo giới thiệu của Tinh Vân thì được đầu tư hơn 1 triệu USD và có vẻ như Tinh Vân đã có một kế hoạch dài hơi cho việc phát triển Xalo.vn và khá tự tin trong cuộc đua với các Công cụ tìm kiếm tiếng Việt mới trong thời gian gần đây.

Lời kết:

Cuộc đua phát triển SE phục vụ cho người Việt và thực sự là Công cụ tìm kiếm tiếng Việt hiệu quả không chỉ là cuộc đua chỉ của các SE được đầu tư và phát triển bởi các công ty Việt Nam mà còn có các đại gia đã “thành danh” trên lĩnh vực SE tại Việt Nam như Google, Yahoo, … Hy vọng rằng với kinh nghiệm của mình trong việc xử lý tiếng Việt và “hiểu tiếng Việt”, những người đã từng thành công với PanVietnam, Hoatieu.com, Vinaseek sẽ có được những thành công với những “khởi đầu mới” của mình.

Nguồn: Timkiemblog
http://360.yahoo.com/timkiemblog