AI của Google có thể tái tạo hình ảnh từ văn bản

Nhóm nghiên cứu của Google đã tìm ra cách để AI của họ có thể tái tạo hình ảnh từ văn bản. Câu văn càng chi tiết, hình ảnh tái tạo được càng chuẩn xác.

[related_posts_by_tax posts_per_page="3" taxonomies="category" order="RAND" public_only="true" title=""]

Chắc hẳn bạn đọc vẫn còn nhớ DeepMind, công ty đã tạo ra trí tuệ nhân tạo mang tên AlphaGo và đánh bại kì thủ cờ vây số một thế giới người Trung Quốc Ke Jie? Ngay sau chiến thắng mang tính lịch sử ấy, AlphaGo đã quyết định “giải nghệ” vì không còn ai đủ sức làm đối thủ của nó. Sau một thời gian có phần “im hơi lặng tiếng”, DeepMind đã quay trở lại cùng với đột phá mới trong lĩnh vực trí tuệ nhân tạo: AI của họ có khả năng tái tạo những hình ảnh chân thực dựa trên dữ liệu dưới dạng văn bản mà con người nhập vào.

Những hình ảnh mà AI của Google tái tạo lại.

Theo Futurism, đây là một trong những bước đột phá mới nhất trong việc tận dụng khả năng của AI vào việc xử lý hình ảnh. Vào tháng Hai, các nhà khoa học Google Brain đã khám phá ra cách để “cải tiến” chất lượng hình ảnh giống như những cách mà bạn thường thấy ở trong các phim khoa học viễn tưởng như Blade Runner hay các phim điều tra tội phạm như series CSI (Crime Scene Investigation). Sử dụng PixelCNN, máy tính sẽ có thể biến các bức ảnh có độ phân giải thấp thành ảnh có độ phân giải cao với độ chính xác vô cùng ấn tượng.

Nay, công nghệ đó sẽ được sử dụng để biến văn bản thành hình ảnh. Các nhà nghiên cứu nhận thấy rằng dữ liệu nhập vào càng chi tiết, ảnh kết quả nhận được sẽ càng chuẩn xác. Ví dụ, nếu dữ liệu đầu vào là “một con chim màu vàng với đầu đen, mắt và mỏ màu da cam” sẽ mang lại hình ảnh giống hệt với yêu cầu. Thuật toán mà DeepMind sử dụng có khả năng chọn lọc từ một bộ sưu tập hình ảnh khổng lồ và phân biệt được các khái niệm như chim muông hay mặt người và từ đó đưa ra kết quả theo như những gì mà nó “học” được.