OpenAI meluncurkan fitur baru yang memungkinkan pengguna membuat gambar langsung dalam antarmuka ChatGPT. Fitur ini didukung oleh model GPT-4o yang dikenal sebagai omnimodal, karena kemampuannya dalam menghasilkan berbagai jenis data seperti teks, gambar, audio, dan video.
Salah satu peningkatan signifikan yang dibawa pembaruan ini adalah kemampuan GPT-4o dalam mengikat, dan mempertahankan hubungan yang tepat antara atribut dan objek dalam gambar. Sebagai contoh, GPT-4o kini dapat dengan akurat menggambarkan 15 hingga 20 objek dengan atribut yang berbeda tanpa banyak kesalahan, sebuah peningkatan dari model sebelumnya yang kerap mengalami kesulitan dalam tugas serupa.

Selain itu, model GPT-4o menunjukkan peningkatan dalam mengolah teks pada gambar, memungkinkan pembuatan teks yang lebih tajam dan bebas dari kesalahan ejaan. Meskipun waktu yang dibutuhkan untuk menghasilkan gambar lebih lama dibandingkan model sebelumnya, OpenAI percaya bahwa kualitas dan kemampuan yang ditingkatkan sepadan dengan penantian tersebut.
Untuk mencegah penyalahgunaan, OpenAI telah menerapkan beberapa langkah keamanan yang ketat, termasuk pemblokiran konten berbahaya dan penambahan metadata C2PA untuk menandai gambar yang dihasilkan oleh AI. Pengguna memiliki hak atas gambar yang dihasilkan, selama penggunaan tersebut sesuai dengan kebijakan yang ditetapkan.
Terlepas dari kecanggihannya, fitur pembuatan gambar di ChatGPT juga mempunyai tantangan. Banyak pengguna melaporkan adanya bias dalam model, di mana permintaan untuk membuat gambar “pria seksi” dipenuhi, sementara permintaan untuk “wanita seksi” ditolak karena melanggar kebijakan.
Selain pembuatan gambar, Sora, alat pembuat video OpenAI, pun mendapat perhatian karena diduga memerpetuasi bias seksis, rasis, dan ableis. Investigasi menemukan Sora sering menggambarkan peran pekerjaan dan penampilan fisik berdasarkan stereotip, seperti pilot dan CEO yang selalu digambarkan sebagai pria, sementara wanita ditampilkan sebagai pramugari.
OpenAI menyadari masalah-masalah tersebut, dan berkomitmen untuk memperbaiki dan menguranginya melalui pelatihan data yang lebih beragam dan evaluasi risiko sosial dalam pengembangan model AI mereka.
Dengan menghadirkan kemampuan membuat gambar di ChatGPT, OpenAI terus berupaya memperluas kemampuan AI mereka dalam menghasilkan konten visual yang realistis dan bermanfaat. Meskipun demikian, tantangan terkait bias dan keamanan tetap menjadi perhatian utama yang perlu ditangani seiring dengan perkembangan teknologi ini.