Feb 4, 2011

on Leave a Comment

Google Tố Cáo Bing Sao Chép Kết Quả Tìm Kiếm



Mới đây, giới công nghệ lại được dịp xôn xao khi 2 “ông lớn” Google và Microsoft to tiếng với nhau, trong đó phía Google cáo buộc công cụ tìm kiếm Bing của Microsoft đã sao chép lại dữ liệu tìm kiếm của Google.

Vụ việc bắt đầu hôm 01/02 vừa qua với bài viết của TBT Danny Sullivan trên trang blog công nghệ uy tín SearchEngineLand: “Google: Bing đã gian lận, sao chép kết quả tìm kiếm của chúng tôi”, trong đó đưa ra các bằng chứng từ phía Google cho thấy việc sao chép dữ liệu tìm kiếm của hãng này trên thanh công cụ tìm kiếm Bing.

Tiếp đó, bất chấp phản hồi của Microsoft: “Chúng tôi không sao chép kết quả tìm kiếm của Google”, trên blog chính thức của Google, kĩ sư phần mềm Amit Singhal đã đưa ra những cáo buộc cứng rắn và những bằng chứng được coi là thuyết phục về việc sao chép này.

Trong bài viết của mình, Amit Singhal đã cung cấp cho người đọc một số cơ sở và chi tiết các thử nghiệm của phía Google để chứng minh việc Bing đã sử dụng kết quả tìm kiếm Google.

Sự việc bắt đầu với từ khóa “tarsorrhaphy”. Đây vốn là từ chỉ một phương pháp phẫu thuật mí mắt hiếm gặp. Mùa hè năm 2010, các kĩ thuật viên Google xem xét kết quả tìm kiếm cho từ “torsorophy”, một truy vấn sai chính tả ít gặp của từ khóa trên và đưa ra gợi ý kết quả đúng chính tả - "tarsorrhaphy” trên trang tìm kiếm của mình. Khi đó, Bing chưa cho kết quả nào đối với từ khóa gõ sai chính tả “torsorophy”.



Tuy nhiên, một thời gian ngắn sau đó, Bing bắt đầu trả về cho người dùng kết quả tìm kiếm giống như của Google, trong khi không hề đưa ra gợi ý chỉnh sửa chính tả.



Amit Singhal nhận xét: “Điều này quá sức kỳ lạ, bởi làm sao họ có thể tìm ra kết quả đó mà không cần đúng chính tả? Nếu họ biết cách viết đúng chính tả, lẽ ra họ đã phải trả về nhiều kết quả phù hợp hơn cho các truy vấn đúng.

Điều này khiến chúng tôi nhận ra vấn đề, và trong vài tháng tiếp đó, chúng tôi nhận ra các đường dẫn từ kết quả tìm kiếm trên Google search sẽ xuất hiện trên Bing với tần suất ngày càng dày đặc, cho tất cả các dạng truy vấn: truy vấn thông thường, truy vấn ít gặp, truy vấn bất thường và cả những truy vấn viết sai chính tả. Thậm chí các kết quả tìm kiếm mà chúng tôi dùng để xét các lỗi thuật toán cũng bắt đầu hiển thị trên Bing.

Chúng tôi cảm nhận rõ ràng có vấn đề đang xảy ra, và nghi vấn trở nên mạnh mẽ hơn từ cuối tháng 10 năm 2010, khi chúng tôi nhận ra tần suất các kết quả top tìm kiếm Google xuất hiện trên bảng xếp hạng của Bing gia tăng ở mức độ đáng kể với nhiều dạng truy vấn khác nhau. Không thể bỏ qua được nữa, chúng tôi quyết định kiểm định giả thuyết của mình bằng cách thử nghiệm xem Microsoft có thực sự sử dụng kết quả tìm kiếm của Google trên Bing hay không.

Để “bắt quả tang” Bing, các kĩ thuật viên của Google đã tạo ra khoảng 100 “truy vấn tổ hợp” – những từ khóa truy vấn vô nghĩa do họ tự nghĩ ra, ví dụ như “hiybbprqag”. Để thí nghiệm, với mỗi từ khóa truy vấn này, họ đưa vào top kết quả tìm kiếm một trang web thực không có giá trị gì đối với truy vấn.

Dưới đây là một ví dụ:



Từ khóa truy vấn này không có quan hệ gì với kết quả tìm kiếm – nghĩa là từ khóa hoàn toàn không xuất hiện trên website, cũng không có đường link nào chứa từ khóa truy vấn. Nói cách khác, khi nhập từ khóa truy vấn, hoàn toàn không có lý do gì để một công cụ tìm kiếm bất kỳ dẫn đến website này.

Tiếp đó, họ chọn 20 kĩ sư với 20 máy tính và cài mới hệ điều hành Microsoft Windows, chạy trình duyệt Internet Explorer 8 có đặt thanh công cụ Bing, trong đó chọn tính năng “Suggested Sites” (các trang gợi ý) của IE8, và để các tùy chọn mặc định cho thanh công cụ Bing.

Tiếp đó, các kĩ sư này gõ các truy vấn tổ hợp vào ô tìm kiếm trên trang chủ Google, rồi click vào kết quả - tức là những kết quả giả do chính Google chèn vào.



Điều hài hước đáng ngạc nhiên là trong vài tuần sau khi bắt đầu thí nghiệm, những kết quả giả do kĩ thuật viên Google chèn vào bắt đầu... xuất hiện trên Bing! Ví dụ: truy vấn với từ khóa “hiybbprqag” trên Bing dẫn đến một trang nói về ghế ngồi trong một rạp hát ở Los Angeles. Như chúng ta đã biết, mối liên hệ duy nhất giữa từ khóa truy vấn này và trang kết quả chính là… trang kết quả của Google.

Điều này cũng xảy ra với nhiều truy vấn khác nhau. Với truy vấn “delhipublicschool40 chdjob”, Google chèn kết quả tìm kiếm dẫn tới trang của một liên minh thẻ tín dụng:



Và kết quả này cũng xuất hiện trên Bing sau đó:



Qua các thí nghiệm trên, phía Google khẳng định nghi ngờ về việc Bing đang sử dụng kết hợp trình duyệt Internet Explorer 8 để gửi dữ liệu tới Microsoft thông qua tính năng Suggested Sites; dùng thanh công cụ Bing để gửi dữ liệu thông qua chương trình hỗ trợ trải nghiệm người dùng của Microsoft; hoặc cũng có thể bằng những cách khác để gửi dữ liệu đến Bing thông qua những gì người dùng tìm kiếm trên Google và những kết quả search Google mà họ click vào.

Những kết quả này từ Google sau đó hiển thị trên Bing. Nói cách khác, một số kết quả tìm kiếm của Bing ngày càng giống như một phiên bản không hoàn thiện của Google – điều mà Google gọi một cách cay độc là “một sự giả mạo rẻ tiền”.

Nhà cung cấp dịch vụ tìm kiếm lớn nhất thế giới cứng rắn khẳng định: “Tại Google, chúng tôi tin tưởng mạnh mẽ vào sự cải tiến và tự hào về chất lượng tìm kiếm của mình. Chúng tôi đã đầu tư hàng ngàn năm lao động vào việc phát triển các thuật toán tìm kiếm, bởi lẽ chúng tôi muốn người dùng tìm thấy câu trả lời đúng mỗi khi cần tìm, và điều đó không hề dễ dàng. Chúng tôi mong muốn cạnh tranh với những thuật toán thực sự mới mẻ, các thuật toán được xây dựng trên một sự đột phá cốt lõi, chứ không phải dựa trên việc “xào nấu” kết quả tìm kiếm của đối thủ cạnh tranh.”

Google cũng chua chát mỉa mai và công kích đối thủ: "Với tất cả người dùng mong muốn những kết quả tìm kiếm xác thực nhất, chúng tôi khuyên bạn nên vào trực tiếp Google. Và với những người hỏi rằng chúng tôi muốn gì sau tất cả những điều này, câu trả lời rất đơn giản: Chúng tôi muốn việc sao chép này chấm dứt."

Đại diện Microsoft hiện đã lên tiếng bác bỏ cáo buộc này và tuyên bố, Bing đã sử dụng hơn 1.000 thuật toán tìm kiếm được Microsoft quản lý nghiêm ngặt. Tuy nhiên, giới công nghệ vẫn đang chờ đợi những bằng chứng thuyết phục hơn từ phía “đại gia” này. Nếu không chứng minh được, đây sẽ là một vụ tai tiếng ảnh hưởng không nhỏ đến uy tín của Microsoft. Nhiều người gọi đây là cái tát choáng váng của Google vào mặt đối thủ.

VTC News via Google blog/SearchEngineLand

0 Nhận xét:

Post a Comment