Máy tính chỉ cần 72 giờ để chơi cờ vua đạt trình độ kiện tướng

Máy tính chỉ cần 72 giờ để chơi cờ vua đạt trình độ kiện tướng

Đã gần 20 năm trôi qua kể từ ngày siêu máy tính Deep Blue của IBM đánh bại “người đánh cờ vua hay nhất thế giới” – đại kiện tướng Gary Kasparov. Và cũng từ lúc đó, những “cỗ máy đánh cờ” ngày càng trở nên lợi hại, tới mức mà rất khó để có thể chiến thắng được những chương trình cờ vua trên điện thoại di động khi đặt ở mức độ khó cao nhất.

Máy tính chỉ cần một khoảng thời gian ngắn để trở thành đại kiện tướng cờ vua

Nhưng mặc dù những cỗ máy tính giờ đây đã chạy nhanh hơn xưa rất nhiều, thì thuật toán mà chúng sử dụng vẫn không hề thay đổi trong suốt hàng chục năm qua. Sức mạnh của những cỗ máy chính là dựa vào khả năng tìm kiếm tất cả những nước đi có khả năng diễn ra, và đưa ra nước cờ tối ưu nhất – một phương pháp có phần tương đối “xôi thịt”.

Và đương nhiên, nếu so về khả năng tính toán nước đi, không người nào có thể bì lại được với máy tính cả. Trong khi siêu máy tính Deep Blue đạt khả năng xử lý trên dưới 200 triệu nước cờ mỗi giây, đại kiện tướng Kasparov chỉ tính toán được 5 nước mỗi giây là nhiều. Tuy vậy nhưng ông vẫn có thể đấu ngang ngửa với siêu máy tính, bằng những kỹ năng “của riêng con người”.

Máy tính chỉ cần 72 giờ để chơi cờ vua đạt trình độ kiện tướng
Trận chiến lịch sử giữa Gary Kasparov và máy tính Deep Blue.

Thông thường khi đánh cờ, chúng ta sẽ quan sát vị trí của tất cả các quân cờ trên bàn, sau đó tính toán trong những nước đi ta cảm thấy có lợi nhất. Điều này làm giảm số lượng nước đi cần tính xuống còn một vài nhánh, trong khi các siêu máy tính phải xử lý tất cả những nước đi có thể thực hiện được.

Việc cân nhắc những thông tin phức tạp như vậy vốn không phải là thế mạnh của máy tính, nhưng đến nay điều đó đã thay đổi nhờ đóng góp của Matthew Lai, một nhà khoa học nghiên cứu tại trường Đại học Hoàng gia London.

Ông đã tạo ra cỗ máy mang tên Giraffe, với khả năng tự dạy bản thân đánh cờ bằng việc đánh giá vị trí các quân cờ trên bàn, giống như con người, thay vì xử lý cả lượng lớn nước đi một cách “xôi thịt” như những cỗ máy trước đây.

Cỗ máy này tuy mới được hoàn thiện, nhưng đã đạt đến trình độ ngang ngửa những “cỗ máy đánh cờ” tốt nhất trên thế giới – vốn đã được tinh chỉnh trong suốt nhiều năm qua. Nếu theo thang đánh giá của Liên đoàn Cờ vua Quốc tế (FIDE), cỗ máy Giraffe đạt trình độ Kiện tướng Quốc tế, bằng với khoảng 2,2% số lượng kì thủ chuyên nghiệp.

Bí mật nằm sau hệ thống của Lai chính là ở hệ thống mạng nơ-ron – một phương pháp xử lý thông tin mô phỏng bộ não con người. Hệ thống này bao gồm nhiều lớp mắt xích sẽ thay đổi phương thức liên kết với nhau tùy theo quá trình học hỏi của máy tính. Qua một khoảng thời gian tự học, hệ thống này có thể đưa ra những kết quả riêng biệt tùy thuộc vào thông tin nó nhận được, chẳng hạn như nhận diện khuôn mặt trong một bức ảnh.

Máy tính chỉ cần 72 giờ để chơi cờ vua đạt trình độ kiện tướng
Cờ vua – môn thể thao tạo nên rất nhiều bài toán cho các lập trình viên.

Trong vài năm trở lại đây, với việc tốc độ máy tính càng ngày càng nhanh khiến cho việc tinh chỉnh hiệu quả hệ thống mạng dễ dàng hơn rất nhiều. Hơn nữa, những bộ dữ liệu khổng lồ luôn sẵn sàng cung cấp cho quá trình học hỏi của máy tính, giúp hệ thống mạng nơ-ron trở nên mạnh mẽ hơn bao giờ hết. Chính những tiến bộ công nghệ trên giúp ích rất nhiều cho các kĩ sư máy tính tạo nên những hệ thống mạng lớn hơn, nhiều lớp hơn, thậm chí còn vượt qua con người trong những lĩnh vực như nhận dạng khuôn mặt hay chữ viết.

Do đó, không quá ngạc nhiên khi hệ thống mạng nơ-ron có thể nhận dạng những thế cờ khác biệt, và đây cũng chính là hướng đi mà Lai tiếp cận cho hệ thống của mình. Mạng lưới của Giraffe gồm 4 lớp cùng nhau đánh giá vị trí các quân trên bàn cờ theo 3 hướng khác nhau.

Hướng thứ nhất là nhìn vào toàn cục của trận đấu, với những thông tin như số lượng quân cờ của mỗi bên trên bàn, đang là lượt đi của đen hay trắng, có thể nhập thành được hay không, v…v… Tiếp theo là đánh giá từng quân cờ riêng biệt, như quân tốt nằm đâu, tượng ở chỗ nào, … Bước cuối cùng là đánh dấu những ô mà các quân cờ có thể di chuyển tới.

Lai “huấn luyện” hệ thống của mình bằng các bộ dữ liệu thu thập được trong các ván cờ thực tế, với những trường hợp có thể xảy ra. “Việc dạy hệ thống những thế cờ mà mỗi bên có tới 3 con Hậu là hoàn toàn không cần thiết, bởi trên thực tế chẳng có ván cờ nào diễn ra như vậy cả”, ông cho biết. Ngoài ra, hệ thống cần phải xử lý được cả những trường hợp hơn hay thiệt quân, thậm chí là chấp quân – vốn không xảy ra trong những ván cờ chuyên nghiệp. Đồng thời bộ dữ liệu đạt chuẩn để huấn luyện cho hệ thống máy tính cần phải đủ lớn, để có thể bao quát đươc tất cả những trường hợp diễn ra trong thực tế.

Bộ dữ liệu của Lai được hình thành bởi việc chọn ra 5 triệu thế cờ bất kỳ trong ngân hàng các ván cờ máy tính. Sau đó, ông biến tấu các thế cờ bằng cách thêm vào những nước đi ngẫu nhiên nhưng đúng luật, trước khi áp dụng bộ dữ liệu này để luyện tập cho máy tính. Kết quả là ông thu được 175 triệu thế cờ khác nhau.

Và phương pháp mà Giraffe dùng để phát triển chính là tự chơi với chính mình, với mục tiêu cải thiện khả năng phán đoán những nước đi tiếp theo có thể diễn ra. Điều này hoàn toàn khả thi, bởi lẽ sẽ có những thời điểm cố định quyết định toàn bộ cục diện trận đấu – thắng, hòa hay thua. Bằng cách này, máy tính có thể học được nước đi nào là mạnh, nước đi nào là yếu.

Sau khi Giraffe hoàn tất quá trình tự học, bước cuối cùng là đánh giá kết quả. Lai thử nghiệm hệ thống của mình trên một bộ dữ liệu cơ ở có tên “Bộ đánh giá chiến thuật”, bao gồm 1500 thế cờ được lựa chọn để đánh giá khả năng nhận biết chiến thuật của máy tính. “Chẳng hạn như, có thể cờ dùng để xem khả năng xử lý những cột trống, thế cờ khác để kiểm tra cách máy tính đánh giá giá trị của Mã và Tượng trong các tình huống khác nhau, hay thế cờ đánh giá khả năng chiếm khu trung tâm của bàn cờ”, ông bổ sung thêm

Máy tính chỉ cần 72 giờ để chơi cờ vua đạt trình độ kiện tướng
Những cỗ máy giờ đây cho con người rất ít cơ hội chiến thắng.

Kết quả của bài kiểm tra này được đánh giá trên thang điểm 15000. Lúc hệ thống bắt đầu việc tự luyện tập, Giraffe đã nhanh chóng đạt được số điểm 6000, và chỉ sau 72 giờ, cỗ máy này đã đạt được số điểm là 9700 – tương đương với những “cỗ máy đánh cờ” tốt nhất thế giời.

“Điều này là đáng kinh ngạc, bởi lẽ quá trình đánh giá của các cỗ máy đánh cờ tốt nhất hiện tại đều vô cùng khổng lồ, và được tinh chỉnh qua rất nhiều năm bởi cả những kĩ sư máy tính lẫn những đại kiện tướng nổi tiếng trên thế giới”.

Lai cho biết thêm, hướng tiếp cận này có xác suất 46% đưa ra được nước cờ tốt nhất, và đánh giá tốp 3 nước cờ mà chúng cho là mạnh nhất với tỉ lệ chính xác đạt 70%. Vậy nên máy tính hoàn toàn có thể bỏ qua tất cả những nước đi khác. Tất nhiên, hướng tiếp cận này vẫn chưa hoàn hảo, với yếu điểm là thời gian cần để hệ thống xử lý dữ liệu tốn gấp 10 lần những cỗ máy đánh cờ thông thường.

Tuy vậy không có nghĩa là Giraffe không có khả năng thi đấu thực tiễn. Theo chuẩn đánh giá của FIDE, trên những cỗ máy tính thông dụng, hệ thống này đạt được trình độ Kiện tướng quốc tế. Trong khi đó, những cỗ máy đánh cờ khác đang chơi ở trình độ Đại kiện tướng.

“Không giống như những cỗ máy đánh cờ khác, sức mạnh của Giraffe không đến từ khả năng xử lý một lượng lớn thông tin để có được một tầm nhìn rất xa về cục diện trận đấu. Khả năng của cỗ máy này là đánh giá những nước đi khó một cách chính xác, cũng như hiểu được bản năng chơi cờ của con người. Điều này là tối quan trọng trong khai cuộc và tàn cuộc, cũng là hai giai đoạn mà cỗ máy này mạnh nhất” – ông Lai bổ sung thêm.

Và đây mới chỉ là điểm bắt đầu. Dự định tiếp theo của Matthew Lai là áp dụng hướng đi này với những trò chơi khác, trong đó có thể kể đến cờ tướng, bộ môn mà con người vẫn đang hoàn toàn áp đảo những cỗ máy đánh cờ. Biết đâu, thế trận này sẽ sớm đổi chiều trong tương lai.

 

Theo Genk