Nếu bạn đang ám ảnh với sự trỗi dậy của trí tuệ nhân tạo (AI), thì nghiên cứu mới của đại học Stanford và Google sẽ khiến bạn khiếp sợ hơn nữa. Còn nếu không, có lẽ bạn sẽ thấy khá thú vị đấy.
Một thuật toán học máy (machine learning), vốn được phát triển nhằm chuyển đổi các hình ảnh trên không thành bản đồ đường phố và ngược lại, đã bị phát hiện… gian lận bằng cách giấu đi thông tin nó sẽ cần sau này trong một “tín hiệu tần số cao gần như không thể nhận ra được“.
Sự việc này làm bộc lộ một vấn đề với máy tính đã tồn tại kể từ khi chúng được phát minh ra: máy móc làm chính xác những gì chúng ta bảo chúng phải làm.
Mục đích của các nhà nghiên cứu là tăng tốc và cải thiện quy trình biến hình ảnh vệ tinh thành các bản đồ với độ chính xác tuyệt vời của Google. Để thực hiện được việc đó, nhóm nghiên cứu đã sử dụng một thứ được gọi là “CycleGAN” – một mạng lưới thần kinh có khả năng học cách chuyển đổi hình ảnh loại X sang loại Y và ngược lại một cách hiệu quả và càng chính xác càng tốt thông qua một loạt các thử nghiệm đặc biệt.
Trong những kết quả ban đầu, thuật toán này hoàn thành tốt – tốt đến mức đáng nghi ngờ. Điều khiến cho nhóm nghiên cứu thắc mắc là, khi thuật toán này dựng nên các tấm ảnh trên không từ bản đồ đường phố, có rất nhiều chi tiết dường như không hề có trên bản đồ đường phố. Ví dụ, các giếng trời trên mái nhà vốn từng bị loại bỏ trong quá trình tạo bản đồ đường phố bỗng tái xuất hiện một cách thần kỳ khi nhóm nghiên cứu yêu cầu thuật toán thực hiện quy trình đảo ngược.
Bản đồ gốc bên trái; bản đồ đường phố tạo ra từ bản đồ gốc ở giữa; và bản đồ nhìn từ trên không tạo ra chỉ từ bản đồ đường phố bên phải. Hãy chú ý sự hiện diện của các chấm trên cả hai bản đồ trên không nhưng không hiện diện trên bản đồ đường phố
Dù rất khó để xem phương thức làm việc bên trong của các quy trình thuộc một mạng lưới thần kinh, nhưng nhóm nghiên cứu lại có thể dễ dàng kiểm tra dữ liệu nó tạo ra. Và với một thử nghiệm nhỏ, họ phát hiện ra rằng CycleGAN quả thực đã đánh lừa những chủ nhân của nó!
Mục tiêu của nhóm nghiên cứu là làm sao để thuật toán có thể diễn dịch các chi tiết của cả hai loại bản đồ và sau đó tìm chi tiết tương ứng của loại bản đồ này trong bản đồ còn lại. Nhưng trên thực tế, nhóm lại chấm điểm thuật toán này dựa trên nhiều yếu tố, trong đó có mức độ giống nhau giữa bản đồ trên không so với bản đồ gốc, cũng như độ rõ ràng của bản đồ đường phố.
Vậy là thuật toán này không hề “học” cách biến một loại bản đồ thành một loại bản đồ khác. Nó học cách mã hóa một cách tinh tế các đặc điểm của bản đồ này vào… những vệt nhiễu hạt trên bản đồ còn lại. Các chi tiết của bản đồ trên không được ghi một cách bí mật vào dữ liệu thị giác thực sự của bản đồ đường phố: hàng ngàn các thay đổi nhỏ trong màu sắc mà mắt người không chú ý ra, nhưng máy tính lại có thể dễ dàng phát hiện.
Sự thực là máy tính giỏi giấu các chi tiết kia vào trong các bản đồ đường phố đến mức nó đã học được cách mã hóa bất kỳ bản đồ trên không nào thành bất kỳ bản đồ đường phố tương ứng. Nó thậm chí không chú ý đế bản đồ đường phố thực sự – mọi dữ liệu cần thiết để tái xây dựng lại hình ảnh trên không có thể được đặt chồng lên nhau hoàn toàn vô hại trên một bản đồ đường phố hoàn toàn khác, theo xác nhận của các nhà nghiên cứu:
Bản đồ bên phải đã được mã hóa vào các bản đồ bên trái mà không gây ra bất kỳ sự thay đổi đáng kể nào về mặt thị giác
Bản đồ màu sắc trong hình (c) ở trên cho thấy những khác biệt nhỏ mà máy tính tạo ra. Bạn có thể thấy rằng chúng tạo nên hình dạng tổng quát của bản đồ trên không, nhưng bạn không bao giờ chú ý đến nó trừ khi xem xét kỹ và phóng đại lên như hình trên.
Hành vi mã hóa dữ liệu vào hình ảnh không hề mới; đó là một loại hình khoa học nổi tiếng với tên gọi steganography, và được sử dụng rất rộng rãi để đóng dấu watermark lên các hình ảnh hay thêm các dữ liệu metadata như thông số máy ảnh chẳng hạn. Nhưng một máy tính tạo ra phương thức steganography của riêng nó để tránh việc phải học cách thực hiện các tác vụ được giao thì lại là một điều chưa từng có tiền lệ (nghiên cứu này được tung ra vào năm ngoái, do đó đến thời điểm này cũng không còn được gọi là “mới” nữa, nhưng nó vẫn khá kỳ lạ).
Người ta có thể nói rằng “máy móc đang trở nên thông minh hơn”, nhưng sự thật thì gần như ngược lại. Máy móc, không đủ thông minh để thực hiện công việc khó khăn là chuyển đổi những loại hình ảnh tinh vi nói trên sang một loại hình ảnh khác, nên đã tìm cách “nói dối” con người – và chúng ta khó lòng phát hiện ra điều đó mà thôi. Tất nhiên, có thể hạn chế được sự dối trá này bằng cách đánh giá nghiêm khắc hơn kết quả mà thuật toán tạo ra, và không còn nghi ngờ gì nữa, chắc chắn sau sự việc này, các nhà nghiên cứu đã phải thực sự làm như vậy.
Vẫn như mọi khi, máy tính vẫn làm chính xác những gì chúng được yêu cầu, do đó bạn phải rất cụ thể trong những mệnh lệnh đưa ra. Trong trường hợp này, giải pháp của máy tính là khá thú vị, và nó làm bộc lộ một điểm yếu của loại hình mạng lưới thần kinh này – đó là máy tính, nếu không bị ngăn cấm, sẽ tìm cách để truyền tải các chi tiết đến chính nó nhằm giải quyết vấn đề được giao một cách nhanh gọn và dễ dàng.
Tình huống này là minh chứng cho một câu ngạn ngữ cổ điển trong ngành điện toán: PEBKAC – “Problem exists between keyboard and chair”, Vấn đề nằm ở giữa bàn phím và ghế. Hay nói dễ hiểu hơn: đó là do lỗi của con người!
Tham khảo: TechCrunch