Thứ Ba, 30 tháng 6, 2009

Bản test trước của VietSpider 3 Build 14

Bản build 14 release trước một phiên bản dành cho test trước khi tung ra chính thức. Ai có nhu cầu dùng thử trước xin mời download tại đây.

Bản dành cho máy đã cài đặt Java 6 trở lên (JRE 6 hoặc JDK 6). Bản chạy trên Windows.

Chủ Nhật, 21 tháng 6, 2009

Build 14 - Chạy đua

Phiên bản VietSpider build 14 hiện đang được hoàn thiện. Một sự cải tiến đáng ghi nhận nữa về tốc độ quét dữ liệu. Phiên bản này cũng đánh dấu việc giảm đáng kể bộ nhớ nhưng vẫn gia tăng tốc độ thực thi.

Thứ Ba, 16 tháng 6, 2009

Làm Search Engine thời Web 2.0: Phần 3 - Phân tích và Ranking

Cuộc đua Search Engine không đơn thuần là cuộc đua làm Online Search, nó là cuộc đua giành quyền kiểm soát dữ liệu của loài người trong tương lai.

Phần 3 loạt bài viết liệt kê một số phương pháp ranking phổ dụng trong các Search Engine hiện nay. Bạn đã từng nghe về Page Rank của Google, liệu nó có còn là thuật toán mấu chốt nằm trong Google Search?

Tác giả: Nguyễn Tuấn Anh

Đọc thêm.
Làm Search Engine thời Web 2.0: Phần 1 - Khai thác dữ liệu
Làm Search Engine thời Web 2.0: Phần 2 - Lưu trữ, đánh chỉ mục và tìm kiếm
5 thách thức lớn nhất với thế hệ tìm kiếm kế tiếp.

Thứ Sáu, 12 tháng 6, 2009

Làm Search Engine thời Web 2.0: Phần 2 - Lưu trữ, đánh chỉ mục và tìm kiếm

Cuộc đua Search Engine không đơn thuần là cuộc đua làm Online Search, nó là cuộc đua giành quyền kiểm soát dữ liệu của loài người trong tương lai.

Ở phần này, chúng tôi đề cập kỹ hơn vấn đề lưu trữ, đánh chỉ mục và tìm kiếm trong bài toán Search Engine. Các đánh giá căn cứ vào phần cứng và phần mềm dùng để triển khai cho hệ thống Search. Bạn muốn biết?

Tác giả: Nguyễn Tuấn Anh

Đọc thêm.
Làm Search Engine thời Web 2.0: Phần 1 - Khai thác dữ liệu
Làm Search Engine thời Web 2.0: Phần 3 - Khai thác dữ liệu
5 thách thức lớn nhất với thế hệ tìm kiếm kế tiếp.

Thứ Năm, 11 tháng 6, 2009

Làm Search Engine thời Web 2.0: Phần 1 - Khai thác dữ liệu

Cuộc đua Search Engine không đơn thuần là cuộc đua làm Online Search, nó là cuộc đua giành quyền kiểm soát dữ liệu của loài người trong tương lai.

Phần 1: Giá trị đọng lại ở dữ liệu chứ không phải công nghệ. (Nguyễn Tuấn Anh)

Đọc thêm.
Làm Search Engine thời Web 2.0: Phần 2 - Lưu trữ, đánh chỉ mục và tìm kiếm
Làm Search Engine thời Web 2.0: Phần 3 - Khai thác dữ liệu
5 thách thức lớn nhất với thế hệ tìm kiếm kế tiếp.

Thứ Tư, 10 tháng 6, 2009

Viết về Search Engine

Đội ngũ làm việc của Headvances bắt đầu viết về Search. Chúng tôi sẽ lần lượt chia sẻ những kinh nghiệm, cách thức, khó khăn,... trong quá trình nghiên cứu và phát triển Search Engine với những người quan tâm.