Tại sao máy tính có thể nhìn?

Thiên nhiên trong mắt con người là thế giới tươi đẹp với đủ sắc màu. Con người có thể cảm nhận hình ảnh của cảnh vật xung quanh bằng mắt, còn có thể hiểu và phân tích được hàm nghĩa của những hình ảnh này dựa theo kinh nghiệm xưa kia. Giờ đây máy tính trên một mức độ nào đó cũng có thể cảm nhận và hiểu biết hình ảnh cảnh vật, tức là trên một mức độ nào đó máy cũng có thể nhìn các vật.

Đã từng có một bài báo viết rằng ngày nào đó đầu thập niên 70, một tên râu xồm leo lên một máy bay từ một sân bay ở Trung Đông đi Pari. Khi máy bay hạ cánh xuống Pari tại nơi kiểm tra của hải quan tên râu xồm đã bị cảnh sát bắt giữ. Đó là vì máy tính đã nhận ra đây là một tên khủng bố. Dù cho tên này có cải trang nhưng vẫn không qua mắt được máy tính. Nguyên do là cảnh sát Pháp trước đó đã có được ảnh của phần tử khủng bố này và họ đã cài hình ảnh vào máy tính. Tại cửa ra vào sân bay, camera điện tử đã giám sát những người khách đi qua và tiến hành xử lý những hình ảnh hành khách như phân tích, đối chiếu. Khi hình ảnh đang xử lý trùng hợp với hình ảnh phần tử khủng bố đã cài vào máy tính thì hệ thống máy tính lập tức báo động cho cảnh sát.

"Con mắt" của máy tính thực tế là thiết bị thu hình tựa như máy quay phim. Với hình ảnh có được từ thiết bị thu hình này, thoạt nhiên phải qua xử lí sơ bộ với sự phối hợp của một số thiết bị chuyên dùng và máy tính nhằm cải thiện chất lượng thị giác. Sau đó chuyển hình ảnh này thành hình thức biểu thị bên trong máy tính, nghĩa là phải số hóa hình ảnh. Bên trong máy tính, mọi thông tin đều được hiển thị bằng mã số. Lượng dữ liệu ảnh số rất lớn. Ví dụ chuyển một bức ảnh số truyền hình đen trắng thành một bức ảnh 512 x 512 x 8 bit (bit map display - màn hình ánh xạ bit- chú thích của người dịch), lượng số liệu của nó sẽ vượt quá 256 kB. Nếu là ảnh màu thì sẽ tăng thêm ba lần nữa. Bởi vậy, cần phải nén và lưu trữ ảnh, nếu không khi phải xử lí hình ảnh liên tục (như phim ảnh) thì không gian lưu trữ sẽ bị lấp đầy hết, đến nỗi máy tính cũng khó bề xử lí nổi.

Tiếp đó, máy tính sẽ tiến hành xử lí đối với những biểu diễn bên trong của hình ảnh bằng một loại biến đổi toán học phức tạp.

Cuối cùng sẽ có hình ảnh ba chiều của vật thể trong cảnh từ những thông tin kể trên. Nhận ra vật thể tồn tại trong đó, xác định vị trí và tư thế của những vật thể này. Rồi lại phối hợp biểu thị này với mô hình vật thể đã có trong kho mô hình hệ thống (tức tiến hành nhận biết). Nhận biết xong sẽ lại tiến hành công việc định vị bước nữa. Điểm này giống với quá trình thị giác của con người. Con người khi nhìn thấy một bức ảnh sẽ phân tách vật thể trong đó và tiến hành kiểm tra tìm kiếm và hồi ức về hình ảnh đó trong đại não, nhận biết ra vật thể rồi từ đó mà thu được thông tin có liên quan đến vật thể này. Đến bước này thì máy tính đã hoàn thành được công việc cảm nhận và tìm hiểu đối với hình ảnh cảnh vật.

Thị giác của máy tính so với thị giác con người thì còn ở giai đoạn cấp thấp. Việc không ngừng nghiên cứu và phát hiện đối với thông tin thị giác con người sẽ có tác dụng thúc đẩy sự phát triển của kĩ thuật thị giác máy tính.

Thế nào là nghịch lí Russel và nghịch lí “người thợ cắt tóc”

Ngày nay lí thuyết tập hợp đã trở thành cách dẫn dắt các kết luận toán học, trở thành công cụ quan trọng cho các luận chứng toán học trong các sách...

Vì sao núi lửa lại hoạt động được?

Núi lửa là hiện tượng nham thạch trong lòng đất phun ra. Bình thường nham thạch bị vỏ Trái Đất bao kín.

Tại sao khi xây đập nước cần phải làm mương máng cho bè gỗ và cá qua lại?

Đập nước còn được gọi là "đập lớn ngăn sông", nó cắt ngang dòng sông, khiến cho nước sông ở phía thượng lưu dồn lại thành hồ chứa nước. Mặt nước trong...

10 hòn đảo lớn nhất thế giới

1. Greenland, Bắc Đại Tây Dương (Đan Mạch) 2.

Tại sao cây mía phần gốc lại ngọt?

Thường có câu nói “gốc của cây mía ngọt, càng gần gốc càng ngon”. Thực ra, nửa phần trên cây mía không ngọt bằng nửa dưới của cây, đặc biệt là phần...

Có thể "dời" cả toà nhà đi được chăng?

Trong quá trình cải tạo thành phố, quy hoạch xây dựng mới thường mâu thuẫn với các công trình kiến trúc hiện có. Thông thường thì người ta dỡ bỏ nhà...

Tại sao đĩa từ có thể lưu trữ tin?

Đĩa từ của máy tính có thể lưu trữ tin vì đã dùng kĩ thuật ghi từ và phương pháp lưu trữ trực tiếp.

Vì sao điện thoại công cộng dễ truyên nhiễm bệnh?

Trong cuộc sống hiện đại, điện thoại đã trở thành công cụ giao dịch thông tin rất phổ cập. Điện thoại có ở gia đình, văn phòng cơ quan, ngoài đường...

Tại sao khi ếch ăn mồi lại chớp mắt?

Ếch là vệ sĩ trong vườn, nó bắt các loại côn trùng để ăn và bảo vệ cho cây trồng được phát triển. Động tác bắt mồi của ếch có một điểm rất lạ là mỗi lần nuốt mồi, ít nhất ếch phải chớp mắt một lần.