
ìm kiếm này là vô vọng. Nhưng giờ đây, dường như lượng tư liệu số hoá trên thế giới tăng vọt đến mức người ta có thể tìm thấy bất kỳ thứ gì.
Thật khó tin, chuỗi từ khoá còn chứa một từ mà Trish thậm chí chưa bao giờ nghe nói đến… và lệnh tìm kiếm vẫn tìm thấy từ đó.
Katherine chạy ào qua cửa phòng điều khiển.
- Cô thu được gì rồi?
- Cả loạt ứng viên - Trish trỏ bức tường plasma - Các tài liệu này đều chứa nguyên văn những cụm từ khoá của chị.
Katherine vén tóc ra sau tai và lướt qua danh sách.
- Chị đừng vội vui mừng, - Trish nói thêm - em có thể đoan chắc với chị rằng hầu hết mớ tài liệu này không phải là những gì chị đang tìm kiếm. Người ta gọi chúng là lỗ đen. Hãy nhìn kích thước của file mà xem. Cực kỳ lớn. Chúng tương tự tệp nén lưu lại hàng triệu thư điện tử, hàng loạt bộ bách khoa thư đồ sộ hoặc tin nhắn trên toàn cầu suốt mấy năm qua, đại loại như thế. Xét theo kích thước và nội dung đa dạng của chúng thì những file này chứa nhiều từ khoá đến mức chúng tiếp nhận bất kỳ cơ chế tìm kiếm nào đến gần.
Katherine trỏ một kết quả ở gần đầu danh sách.
- Cái này thì sao?
Trish cười. Katherine rất nhanh mắt, tin ngay ra file duy nhất có kích thước nhỏ.
- Mắt chị tinh lắm. Đúng, đó là ứng viên duy nhất của chúng ta đấy Trên thực tế, file đó nhỏ đến mức nó có thể không dài quá một trang đâu.
- Mở ra xem nào - Giọng Katherine đầy hồi hộp.
Trish không thể tin nổi là một tài liệu độ một trang lại chứa tất cả những chuỗi tìm kiếm lạ lùng mà Katherine đưa cho cô. Tuy nhiên, khi cô nhấn vào tài liệu để mở nó, các cụm từ hiện ra rất… rõ rệt và dễ nhận thấy trên văn bản.
Katherine sải bước tới gần, mắt dán chặt vào bức tường plasma.
- Tài liệu này đã bị… lọc.
Trish gật đầu.
- Chào mừng đến với thế giới văn bản số hoá.
Lọc tài liệu tự động đã trở thành một cách làm chuẩn mực khi cung cấp những tài liệu số hoá. Lọc tài liệu là một quá trình trong đó máy chủ cho phép người sử dụng tìm kiếm toàn bộ văn bản, nhưng chỉ tiết lộ một phần nhỏ của nó, tức là phần nội dung khớp với các từ khoá yêu cầu. Bằng cách loại bỏ đa số nội dung văn bản, máy chủ tránh được việc vi phạm bản quyền và cũng gửi kèm cho người sử dụng một thông điệp gợi tò mò: Tôi có thông tin quý vị đang tìm kiếm, nhưng nếu quý vị muốn phần còn lại, quý vi sẽ phải mua nó.
- Chị thấy đấy, - Trish nói, lướt qua trang văn bản đã bị lược bỏ rất nhiều - tài liệu này có đủ tất cả những cụm từ khoá của chị.
Katherine im lặng, đăm đăm nhìn đoạn văn bản hổng lỗ chỗ.
Trish để cho cô đọc khoảng một phút rồi quay trở về đầu trang.
Mỗi cụm từ khoá của Katherine đều được gạch chân và viết hoa, kèm theo một phần nội dung văn bản tìm thấy, đó là vài từ xuất hiện mỗi bên của cụm từ cần tìm.
Trish không hình dung nổi nội dung của tài liệu, và còn “đồ hình” là cái quái gì nữa không biết?
Katherine háo hức bước lại gần màn hình.
- Tài liệu này từ đâu ra vậy? Ai viết nó?
Trish đang xử lý tài liệu.
- Cho em một giây thôi. Em đang tìm cách truy nguyên.
- Tôi cần biết ai viết tài liệu này, - Katherine nhắc lại, giọng đanh hơn - Tôi muốn xem phần còn lại của nó.
- Em đang tìm cách, - Trish đáp, giật mình vì giọng nói sắc lạnh của Katherine.
Lạ thay, vị trí của file không hiển thị như một địa chỉ web truyền thống mà lại là một địa chỉ Giao thức Intemet (IP) số.
- Em không truy được IP, - Trish thông báo - Tên miền không xuất hiện. Xem nào! - Cô kéo cửa sổ gốc của mình lên - Em sẽ chạy lệnh truy dấu.
Trish gõ chuỗi lệnh để ping(48) tất cả các “bước truyền” giữa máy móc trong phòng điều khiển của cô và bất cứ máy nào đang lưu tài liệu này.
- Truy tìm ngay nào, - cô nói và cho chạy lệnh.
Lệnh truy dấu hoạt động cực nhanh, và một danh sách dài dằng dặc các thiết bị mạng xuất hiện gần như ngay lập tức trên bức tường plasma. Trish lướt xuống phía dưới… xuống nữa… qua tất cả các thiết bị định tuyến và chuyển đổi có kết nối với máy của cô…
- Thế quái nào ấy nhỉ?
Lệnh truy dấu của cô dừng lại trước khi đến được máy chủ của tài liệu. Vì một lý do nào đó, lệnh ping của cô vấp phải một thiết bị mạng nuốt chửng nó thay vì hất nó trở lại.
- Xem chừng lệnh truy dấu của em bị chặn, - Trish nói. Trường hợp này cũng có thế xảy ra ư?
- Cho chạy lại đi.
Trish chạy lệnh truy dấu khác và gặp kết quả tương tự.
- Không được. Ngõ cụt rồi. Hình như tài liệu này nằm trên một máy chủ không thể truy dấu được - Cô nhìn những bước truyền cuối cùng ngay trước “ngõ cụt” - Nhưng em đoan chắc với chị rằng nó nằm đâu đó ở Washington D.C. này thôi.
- Cô đùa đấy à?
- Có gì lạ đâu chị, - Trish nói - Các chương trình nhện này chạy xoắn ốc theo yếu tố địa lý, có nghĩa là những kết quả đầu tiên luôn gần quanh đây, thêm nữa, một trong các chuỗi tìm kiếm của chị là “Washington D.C.” mà.
- Nếu dùng giao thức “who is”(49) thì sao? - Katherine gợi ý - Liệu nó có cho cô biết ai sở hữu tên miền không?
Hơi vớ vẩn nhưng không phải là một ý tưởng tồi. Trish tìm tới cơ sở dữ liệu “who is” và chạy lệnh tin kiếm IP, hy vọng khớp được các con số bí ẩn với một tên miền có thật. Tâm trạng thất vọng của