Các thuật toán để vẽ tranh biếm họa được phát triển bởi các nhà khoa học máy tính tại Microsoft và Đại học Thành phố Hồng Kông. Các kỹ sư đã tạo ra hai hệ thống AI riêng biệt, tạo thành một loại mạng nơ-ron nhân tạo mang tên Generative Adversarial Network (GAN). Một trong những thuật toán trên sẽ tạo ra hình ảnh thực tế của dữ liệu đầu vào (cụ thể là tranh chân dung), trong khi các thuật toán khác đối chiếu đầu ra với các mẫu bức ảnh ngoài đời thực nhằm đánh giá công việc.
Trong nghiên cứu này, một trong hai mạng GAN được thiết kế để phân tích và phóng đại các đặc điểm khuôn mặt nhất định từ các bức ảnh được tải lên. Mạng GAN còn lại sẽ bổ sung vài nét bút và phong cách nghệ thuật thường thấy trong các bức biếm họa. "Từ đó, bài toán chuyển đổi tên miền chéo phức tạp được tách ra thành hai nhiệm vụ đơn giản hơn" - các tác giả khẳng định khi đề cập đến các mạng nơ-ron tùy chỉnh được gọi là các mạng CariGAN.
Thú vị ở chỗ, các thuật toán cũng có thể hoạt động ngược lại: chuyển đổi bức biếm họa thành các hình ảnh chân thực y như ảnh chụp.
Tuy nhiên, CariGAN vẫn còn tồn tại một số hạn chế. Mức độ phóng đại hình học được thể hiện rõ nét hơn ở hình dạng khuôn mặt tổng thể so với các đặc điểm khuôn mặt khác. Hơn nữa, một số mức độ phóng đại hình học chi tiết trên tai, tóc, nếp nhăn, v.v không thể được áp dụng hết bởi vì các thuật toán chỉ có thể đọc 33 trên 63 điểm mốc nằm trên khối khuôn mặt. Các nhà nghiên cứu cho biết, giới hạn này có thể được giải quyết bằng cách bổ sung thêm nhiều điểm mốc trên mặt.
Thậm chí, AI còn có thể tạo ra nghệ thuật biếm họa ở dạng video. Trong một đoạn clip của nhóm nghiên cứu, tổng thống Donald Trump đang đưa ra bài phát biểu theo phong cách biếm họa, với những đặc điểm trên khuôn mặt đã được cường điệu hóa bởi AI theo từng khung hình.
Các thuật toán biếm họa sẽ được công bố chính thức trong cuộc hội nghị SIGGRAPH Asia 2018 tổ chức tại Tokyo vào tháng 12. Trong khi đó, bài nghiên cứu đã được xuất bản tại trang Arxiv dùng làm cơ sở lưu trữ.
D.N