Nhận dạng khuôn mặt, hy vọng xen với âu lo

Chủ Nhật, 13/09/2015, 06:05

Công nghệ nhận diện khuôn mặt thường được sử dụng cho nhiều mục đích, nhưng phổ biến nhất vẫn là an ninh và hành pháp. Việc Cục Điều tra liên bang Mỹ (FBI) khởi động hệ thống nhận diện thế hệ mới NGI, vốn tiêu tốn 1 tỉ USD để thiết kế và phát triển đã cho thấy nó được coi là công cụ hỗ trợ đắc lực cho giới điều tra trong các chiến dịch bắt giữ tội phạm hoặc lần theo các mưu đồ tội ác.

Trong số các kỹ thuật sinh trắc học, nhận dạng khuôn mặt có thể không đáng tin cậy và thiếu hiệu quả. Tuy nhiên, một trong những lợi thế quan trọng là nó không đòi hỏi sự hợp tác của các đối tượng thử nghiệm. Các hệ thống nhận dạng được được lắp đặt tại nơi công cộng có thể xác định một cá nhân giữa đám đông. Sinh trắc học khác như dấu vân tay, quét mống mắt, và nhận dạng giọng nói không thể thực hiện được như vậy.

Máy tính sẽ thay thế con người

Từ năm 1964, Woody Bledsoe, cùng với Helen Chan Wolf và Charles Bisson, bắt đầu ý tưởng sử dụng máy tính để nhận dạng khuôn mặt của con người. Do kinh phí được cấp bởi một cơ quan tình báo giấu tên nên đã có rất ít tác phẩm được xuất bản vào thời kỳ này.

Với một tập hợp cơ sở dữ liệu hình ảnh lớn (thực tế là một cuốn sách ảnh thẻ), vấn đề đặt ra là phải lựa chọn từ cơ sở dữ liệu một bức ảnh khớp với yêu cầu đề ra. Dự án này đã được dán nhãn “man-machine” bởi vì con người trích xuất tọa độ của một tập hợp các đặc điểm từ các hình ảnh, sau đó được máy tính sử dụng để nhận dạng. Các thuật toán sẽ trích xuất tọa độ của các đặc điểm như tâm của con ngươi, các góc bên trong mắt, góc ngoài của mắt,... Từ những tọa độ này, một danh sách 20 khoảng cách, như chiều rộng của miệng và khoảng cách giữa 2 mắt sẽ được tính toán.

Các toán tử có thể xử lý khoảng 40 hình ảnh một giờ. Khi xây dựng các cơ sở dữ liệu, tên của người trong bức ảnh đã được gắn liền với danh sách của các khoảng cách tính toán và được lưu trữ trong máy tính.

Trong giai đoạn nhận dạng, tập hợp các khoảng cách được so sánh với khoảng cách tương ứng cho mỗi bức ảnh yêu cầu. Bởi vì không chắc rằng bất kỳ hai hình ảnh sẽ khớp nhau (do góc chụp của ảnh, khoảng cách tới máy ảnh) nên mỗi bộ khoảng cách được chuẩn hóa để đại diện cho khuôn mặt theo hướng nhìn từ phía trước. Để thực hiện việc này, chương trình sẽ cố gắng xác định độ nghiêng, xoay đầu, cúi đầu và sau đó sử dụng các góc độ này máy tính sẽ loại bỏ những biến dạng của hình ảnh theo các thuật toán.

Woody Bledsoe và Peter Hart cùng cộng tác tại Viện nghiên cứu Stanford trên một cơ sở dữ liệu với hơn 2.000 bức ảnh. Theo kết quả so sánh, máy tính luôn vượt trội so với con người khi thể hiện cùng một yêu cầu nhận dạng.

Tới năm 1997, hệ thống nhận dạng khuôn mặt được phát triển bởi Christoph von der Malsburg ở Đại học Bochum, Đức và Đại học Nam California, Mỹ. Nó được thông qua và tài trợ bởi Phòng thí nghiệm nghiên cứu Quân sự Mỹ. Phần mềm này đủ mạnh mẽ để nhận dạng được gương mặt từ góc nhìn bị hạn chế, kể cả được thay đổi bởi kiểu tóc, râu, hoặc thậm chí đeo kính.

Năm 2006, các thuật toán nhận dạng khuôn mặt mới nhất đã được đánh giá trong một cuộc thi nhận dạng khuôn mặt Face Recognition Grand Challenge. Hình ảnh gương mặt, hình ảnh scan gương mặt 3D và ảnh có độ phân giải cao, được sử dụng trong các bài kiểm tra.

Kết quả cho thấy rằng các thuật toán mới chính xác hơn 10 lần so với các thuật toán nhận dạng khuôn mặt của năm 2002 và chính xác hơn 100 lần so với các thuật toán của năm 1995. Một số thuật toán đã có thể nhận dạng tốt hơn người tham gia trong việc nhận diện khuôn mặt và thậm chí có thể xác định từng người trong các cặp song sinh giống hệt nhau.

Nhận dạng khuôn mặt 3D và phân tích kết cấu da

Identix, một công ty có trụ sở tại Minnesota, là một trong nhiều nhà phát triển của công nghệ nhận dạng khuôn mặt. Phần mềm FaceIt của họ có thể chọn khuôn mặt của một người ra khỏi một đám đông, trích xuất các mặt từ phần còn lại của cảnh và so sánh nó với một cơ sở dữ liệu của hình ảnh được lưu trữ. Phần mềm này biết cách phân biệt giữa một khuôn mặt và phần còn lại của nền. Facelt mô phỏng khả năng nhận biết khuôn mặt của người và sau đó đo các điểm khác nhau của khuôn mặt. Mỗi khuôn mặt có nhiều mốc phân biệt, các vùng cao và thấp tạo nên đặc điểm khuôn mặt, những “đỉnh” và “thung lũng” này được gọi là các điểm nút. Mỗi khuôn mặt con người có khoảng 80 điểm nút.

Các phép đo cơ bản dựa trên: Khoảng cách giữa hai mắt; chiều rộng của mũi; độ sâu của hốc mắt; hình dạng của xương gò má; chiều dài của đường quai hàm. Những điểm nút được đo tạo ra một mã số, gọi là một faceprint, đại diện các khuôn mặt trong cơ sở dữ liệu.

Phần mềm nhận dạng khuôn mặt trước kia thường phải dựa trên một hình ảnh 2D với người cần nhận dạng gần như phải trực tiếp đối mặt với máy ảnh. Hình ảnh chụp rõ nét trong điều kiện ánh sáng tốt sẽ cho hiệu quả và chính xác hơn trong việc tìm kiếm. Điều này thực sự là một vấn đề khó khăn. Trong hầu hết các trường hợp, các hình ảnh không được thực hiện trong môi trường lý tưởng.

Sự thay đổi về hướng nhìn, ánh sáng có thể làm giảm hiệu quả của hệ thống. Bây giờ, với FaceIt, một hình ảnh 3D có thể được so sánh với một hình ảnh 2D bằng cách chọn 3 điểm cụ thể trên tấm hình 3D và chuyển đổi nó thành một hình ảnh 2D sử dụng một thuật toán đặc biệt có thể được quét qua hầu như tất cả các cơ sở dữ liệu. Kỹ thuật này được tuyên bố là cải thiện được độ chính xác, sử dụng các cảm biến 3D để nắm bắt thông tin về hình dạng của khuôn mặt.

Những điểm nút trên khuôn mặt được máy tính đánh dấu để nhận dạng.

Thông tin này sau đó được sử dụng để xác định các tính năng đặc biệt trên bề mặt của một khuôn mặt, chẳng hạn như các đường viền của hốc mắt, mũi và cằm. Một lợi thế của nhận dạng khuôn mặt 3D là nó không bị ảnh hưởng bởi những thay đổi trong ánh sáng như các kỹ thuật khác.

Nó cũng có thể xác định một khuôn mặt từ một loạt các góc nhìn, trong đó có góc nhìn nghiêng. Các điểm dữ liệu ba chiều từ một khuôn mặt cải thiện lớn độ chính xác cho nhận dạng khuôn mặt. Các cảm biến hoạt động bằng cách chiếu ánh sáng có cấu trúc lên gương mặt. Hàng chục hoặc nhiều hơn nữa các bộ cảm biến hình ảnh này có thể được đặt lên trên cùng một con chip CMOS-mỗi cảm biến sẽ thu một phần khác nhau của hình ảnh.

Không phải lúc nào hình ảnh cũng có thể được xác định hoặc trùng khớp với hệ thống cơ sở dữ liệu. Khi đó, sinh trắc học da dựa vào sự độc đáo của cấu trúc làn da sẽ mang lại kết quả chính xác. Phương pháp này sử dụng các chi tiết hình ảnh của da, được chụp trong các hình ảnh kỹ thuật số hoặc máy quét. Phần mềm sẽ phân tích kết cấu da, đưa các đường đặc trưng, hình dạng, các điểm nốt trên da và đưa chúng vào một không gian toán học. Các thử nghiệm đã chỉ ra rằng với việc bổ sung các phân tích cấu trúc của da, tính chính xác trong việc nhận ra khuôn mặt có thể tăng lên 20~25%.

Tiềm năng và trở ngại

Trong quá khứ các cơ quan thực thi pháp luật, những người sử dụng hệ thống này để chụp lại những khuôn mặt ngẫu nhiên trong đám đông. Một số cơ quan chính phủ cũng đã sử dụng hệ thống này để bảo mật và hạn chế gian lận bầu cử.

Bộ Ngoại giao Mỹ điều hành một trong các hệ thống nhận dạng khuôn mặt lớn nhất trên thế giới với hơn 75 triệu bức ảnh được chủ động sử dụng để xử lý visa. Dấu vân tay và hình ảnh của du khách được đối chiếu với cơ sở dữ liệu tội phạm và nghi can khủng bố. Sau đó dữ liệu này sẽ được kiểm tra ở cửa khẩu để đảm bảo người được cấp thị thực và trên thực tế là một. Hệ thống nhận dạng khuôn mặt cũng được nâng cấp khả năng tương thích với hệ thống camera và máy tính đã được sử dụng ở ngân hàng và các sân bay.

Công nghệ nhận dạng khuôn mặt có thể được sử dụng như một biện pháp an ninh tại các máy ATM. Thay vì sử dụng một thẻ ngân hàng hoặc số nhận dạng cá nhân, máy ATM sẽ chụp một hình ảnh của khuôn mặt của khách hàng, và so sánh nó với các bức ảnh của chủ tài khoản ngân hàng trong cơ sở dữ liệu để xác nhận danh tính của khách hàng.

Tuy nhiên, vẫn có những người phản đối hệ thống này, họ cho rằng hình ảnh của mình đã bị sử dụng khi không được phép. Những người phản đối cảm thấy bị mất tự do và coi đây là hành vi xâm phạm quyền riêng tư. Các tổ chức quyền công dân, và các nhà vận động quyền riêng tư như Electronic Frontier Foundation và American Civil Liberties Union bày tỏ lo ngại rằng sự riêng tư đang bị xâm phạm bằng cách sử dụng các công nghệ giám sát.

Một số người sợ rằng nó có thể dẫn đến một “xã hội giám sát toàn diện” với việc chính phủ và các cơ quan khác có khả năng biết nơi ở và hoạt động của tất cả các công dân suốt ngày đêm. Nhiều cơ cấu quyền lực tập trung với khả năng giám sát đã lạm dụng đặc quyền truy cập của họ để duy trì sự kiểm soát của bộ máy chính trị và kinh tế, và để ngăn chặn những cải cách dân sự.

Nhận dạng khuôn mặt có thể được sử dụng không chỉ để xác định một cá nhân, mà còn để tìm ra dữ liệu cá nhân khác liên quan đến một cá nhân, như hình ảnh, bài viết, hồ sơ mạng xã hội, lịch sử trên mạng,… Phương tiện truyền thông, đặc biệt là các trang mạng xã hội như Facebook có số lượng rất lớn các bức ảnh cá nhân với nhiều thông tin cụ thể. Điều này có thể hình thành một cơ sở dữ liệu mà có thể được sử dụng (hoặc bị lạm dụng) bởi các cơ quan chính phủ cho các mục đích nhận dạng khuôn mặt.

Ngay cả các công ty nghiên cứu công nghệ nhận dạng khuôn mặt cũng thừa nhận rằng, công nghệ càng được sử dụng rộng rãi thì nguy cơ về hành vi trộm cắp danh tính, gian lận sẽ càng tăng cao. Cũng như nhiều công nghệ đang phát triển khác, tiềm năng của nó đi kèm với một số mặt hạn chế, và trong tương lai các nhà sản xuất đang phấn đấu để nâng cao khả năng sử dụng và tính chính xác của hệ thống.

Hoàng Ngọc