Máy móc sẽ thông minh hơn khi có thể nhìn và lĩnh hội mọi thứ xung quanh. Đây là điều mà các nhà nghiên cứu tại đại học Cambridge hướng đến khi phát triển 2 công nghệ khai thác khả năng học hỏi qua tầm nhìn camera, từ đó mang lại khả năng nhận biết, phân loại và vận dụng các vật thể cho máy móc.
2 công nghệ đang được phát triển có tên gọi SegNet và một hệ thống định vị chưa có tên. SegNet là một ứng dụng nhận diện vật thể theo thời gian thực, nó có thể đặt nhãn cho các vật thể chính xác hơn nhiều so với các hệ thống radar tiên tiến nhất hiện nay dùng trên xe hơi tự hành. SegNet có thể quan sát một quang cảnh đường phố và ngay lập tức nhận dạng các nội dung có trong quang cảnh đồng thời phân loại nội dung vào 12 danh mục như đường sá, tín hiệu đường, người đi bộ, công trình …
Hệ thống hoạt động trong môi trường tối lẫn sáng và gần như theo thời gian thực. Mặc dù hiện tại chỉ vừa được thử nghiệm trong môi trường đô thị nhưng SegNet sẽ khai thác công nghệ học hỏi để xây dựng các khả năng và sau cùng sẽ có thể nhận biết các vật thể trong nhiều môi trường hơn, đặc biệt là vùng ngoại ô cũng như dưới nhiều điều kiện thời tiết và khí hậu khác nhau.
Alex Kendall, nghiên cứu sinh tiến sĩ tại khoa kỹ thuật thuộc đại học Cambridge cho biết: “SegNet có khả năng nhận diện vật thể trong một bức ảnh rất tốt bởi nó được thực hành nhiều. Tuy nhiên, vẫn có hàng triệu điểm cần tinh chỉnh để hệ thống có thể hoạt động tốt hơn”.
SegNet được dạy bởi các sinh viên sắp tốt nghiệp tại đại học Cambridge. Họ nạp vào hệ thống 5000 hình ảnh với quang cảnh đường phố, mỗi tấm hình có các vùng điểm ảnh được dán nhãn phân loại. SegNet đã học cách nhận biết hình ảnh qua thời gian và sau cùng tự mình thực hiện điều này mà không cần đến sự chỉ dẫn của các nhà nghiên cứu.
Hệ thống định vị này có thể nhận biết các ví trí đã được học với phạm vi sai số trong chỉ vài mét.
Như thử nghiệm của mình dưới đây, mình đăng tải một tấm hình về một tai nạn hài hước… xe con tông xe tăng và SegNet đã nhận dạng được các vật thể trong bức ảnh khá chính xác. Khu vực màu tím là phương tiện, khu vực màu tím nhạt hơn là đường, màu xanh là vỉa hè (thực ra là nền bê tông), màu cỏ úa là cây cối và đậm hơn là người đi bộ (thực chất là anh lính xe tăng).
Đi kèm với SegNet là một hệ thống định vị hoạt động trên nguyên lý tương tự. Hệ thống này giúp nhận biết một địa điểm dựa trên những gì được nhìn thấy thông qua camera. Độ chính xác của hệ thống cao hơn nhiều so với GPS và hoạt động trong mọi tình huống miễn là camera có thể quan sát được xung quanh, bao gồm trong nhà lẫn ngoài trời, trong đường hầm hay thậm chí dưới các điều kiện thiếu sáng.
Cho đến hiện tại, hệ thống định vị này có thể nhận biết các ví trí đã được học với phạm vi sai số trong chỉ vài mét. Hệ thống hoạt động ở cả 2 cấp độ bản đồ và thực địa, chẳng hạn như bên trong hoặc xung quanh một tòa nhà nơi camera được đặt. Ngoài ra, hệ thống này cũng có thể học hỏi về môi trường xung quanh vị trí được sử dụng. Các nhà phát triển tin rằng hệ thống trước mắt sẽ được sử dụng trên các robot dùng trong nhà và sau cùng sẽ mở rộng ra nhiều vật thể di động khác chẳng hạn như xe hơi không người lái hoặc thiết bị đeo được.
Theo Tinh Tế