AI Buatan Microsoft Mampu Menciptakan Gambar Berdasarkan Deskripsi yang Kita Berikan
Gambarnya amat realistis, sampai-sampai sepintas kelihatan seperti foto
Kita sudah melihat kebolehan AI dalam mendeskripsikan gambar atau apapun yang sedang 'dilihat' olehnya. Pencapaian ini kemudian memunculkan pertanyaan sebaliknya: bisakah AI menciptakan gambar sesuai dengan deskripsi yang kita berikan? Lagi-lagi jawabannya datang dari tim peneliti Microsoft.
Mereka mengembangkan AI yang mampu membuat gambar super-realistis berdasarkan kalimat yang kita berikan, semisal "burung ini berwarna merah dan putih, serta mempunyai paruh yang amat pendek." Tidak lama kemudian, AI tersebut akan menciptakan gambar beresolusi 256 x 256 pixel yang sepintas kelihatan seperti foto.
AI ini diberi nama AttnGAN, diambil dari cara kerjanya yang melibatkan algoritma Generative Adversarial Network (GAN), serta pendekatan yang attentive, alias begitu peka terhadap detail-detail kecil. Proses penciptaan gambarnya terbagi menjadi tiga tahap, dan di setiap tahap, ada dua AI yang bekerja bersama; satu membuat gambarnya, satu lagi mengevaluasi sekaligus mengkritisinya.
Detail-detail kecil seperti "paruh yang pendek" juga dijadikan pertimbangan selama proses pembuatan gambarnya. Sejauh ini, AttnGAN cukup terlatih dalam membuat gambar/foto burung, namun masih kesulitan membuat gambar yang sesuai ketika deskripsi yang kita berikan melibatkan lebih dari satu objek, terutama yang konteksnya tidak rasional.
Contohnya, ketika diminta untuk membuat gambar sebuah bis tingkat berwarna merah yang mengapung di atas danau, AttnGAN malah membuatkan gambar sebuah perahu merah di atas danau. Kemampuan belajar AI pada dasarnya membuatnya paham bahwa bis tidak bisa mengapung di atas air, sehingga akhirnya ia malah menggambar sebuah perahu.
Imajinasi tidak harus sejalan dengan akal sehat, dan untuk sekarang AI masih kesulitan memisahkan keduanya. Dalam kasus AttnGAN, AI sepertinya masih lebih condong ke akal sehat, dan itu banyak dipengaruhi oleh bahan-bahan yang selama ini dipelajarinya.
Dalam beberapa tahun ke depan, tim pengembang AttnGAN percaya bahwa AI bisa menciptakan gambar yang lebih detail dan beresolusi lebih tinggi. Namun yang mungkin menjadi pertanyaan adalah, untuk apa itu semua?
Pimpinan proyek pengembangan AttnGAN, Xiaodong He, membayangkan teknologi ini bisa dipakai untuk, misalnya, sistem pencarian gambar di Bing. Jadi ketika pengguna melakukan pencarian suatu gambar, dan gambarnya ternyata tidak ditemukan di berbagai sumber, Bing akan menginstruksikan AI untuk membuat gambar sesuai permintaan pengguna.
Ketika skenario ini sudah bisa diwujudkan, saya yakin akan muncul pertanyaan baru: siapa yang berhak menerima kredit atas gambar yang diciptakan, apakah AI-nya atau si Xiaodong He beserta timnya?
Sumber: Fast Company.