Công cụ xác định mức độ dễ nhớ của một bức ảnh

Đây là một công cụ trực tuyến dựa trên mạng nơ ron thần kinh nhân tạo do nhóm nghiên cứu tại MIT phát triển với khả năng xác định chính xác thành phần nào của bức ảnh là dễ nhớ hoặc khó nhớ đối với người xem. Mục tiêu của nghiên cứu là tìm hiểu về hoạt động của trí nhớ con người nhưng họ cũng “rộng rãi” phát hành công cụ này cho chúng ta xài thử.

[related_posts_by_tax posts_per_page="3" taxonomies="category" order="RAND" public_only="true" title=""]

Trí nhớ là một món quà kỳ diệu mà tạo hóa đã ban cho con người mà nếu không có, chúng ta sẽ không thể học tập, không thể rút kinh nghiệm những sai lầm, không thể nhận diện bạn bè và đi lại khắp nơi trên thế giới này. Các nhà khoa học vẫn chưa hiểu được điều gì khiến cho một vấn đề cụ thể trở nên dễ nhớ hoặc dễ quên và để làm tìm hiểu điều này, các nhà nghiên cứu tại Viện công nghệ Massachusetts (MIT) đã phát triển nên một thuật toán quét hình ảnh.

Sau khi tiến hành nhiều nghiên cứu mang tính phổ quát, nhóm nghiên cứu đã tạo nên một mạng nơ ron xoắn (CNN) với khả năng dự đoán chính xác “mức độ ghi nhớ” của một bức ảnh. Về cơ bản, CNN là một mạng nơ ron nhân tạo được thiết kế mô phỏng sự sắp xếp của các tế bào thân kinh trong vỏ não phụ trách cơ quan thị giác, xử lý thông tin hình ảnh. Các mạng lưới này có thể tự học tập sâu (deep learning), xử lý một lượng lớn dữ liệu nhằm xác định các mô hình ẩn chứa trong đó. Nói cách khác, chúng có thể tự tìm hiểu thông tin mà không đòi hỏi lập trình trước.

Quá trình phân tích mức độ dễ nhớ của bức ảnh với các điểm số theo thang điểm từ 0 tới 1.

Trong báo cáo đăng tải trên tạp chí của Phòng thí nghiệm khoa học máy tính và trí tuệ nhân tạo thuộc MIT, nhóm nghiên cứu đã giải thích quá trình thực hiện một loạt các thí nghiệm nhàm xác định việc ghi nhớ của con người. Trong đó có một thí nghiệm chiếu một chuỗi các hình ảnh, một số được lặp lại, và yêu cầu các tình nguyện viên phải bấm một nút mỗi khi họ phát hiện ra một bức ảnh đã nhìn thấy trước đó.

Tiếp theo, các nhà nghiên cứu phân tích các bức ảnh nhằm xác định các đặc điểm của một bức ảnh nhằm xác định đâu là cái chịu trách nhiệm giúp chúng ta ghi nhớ. Điển hình như nhóm phát hiện rằng đối với ảnh của con người sẽ dễ nhớ hơn là cảnh vật. Và tổng hợp các nghiên cứu lại, nhóm nghiên cứu đã tạo nên một thuật toán có thể dự đoán mức độ dễ nhớ hoặc dễ quên của một bức ảnh.

Theo đó, CNN có thể đạt hệ số tương quan là 0.64. Với điểm số này khá gần với khả năng nhận diện vật thể của con người, cho thấy thuật toán này hoàn toàn có khả năng để dự đoán mức độ dễ nhớ của hình ảnh. Nhóm gọi thuật toán này là MemNet và theo họ, nhóm nghiên cứu cho rằng thuật toán có thể ứng dụng rất rộng vào thực tế. Thí dụ, nắm được bản chất của việc ghi nhớ, người ta có thể tăng cường các yếu tố đó lên để đảm bảo người nhìn có thể ghi nhớ dễ dàng, sâu sắc hơn.