Dalam keenam kategori tersebut, ChatGPT mendapatkan skor di atas 50 persentil.
• Prediksi Bill Gates Tidak Lama Lagi ChatGPT Bisa Menjadi Guru Virtual Gantikan Manusia
Dari 6 kategori tersebut, ChatGPT paling unggul di ujian evidence-based reading & writing (SAT) dengan skor 87 persentil.
Persentil ini menjelaskan peringkat skor peserta ujian dibandingkan dengan yang lain.
Misalnya, bila ChatGPT mendapatkan 87 persentil di kategori evidence-based reading & writing (SAT).
Maka artinya sebanyak 87 persen peserta ujian lainnya mendapatkan skor lebih rendah dibandingkan ChatGPT.
Lalu ada 13 persen peserta ujian yang memiliki skor lebih tinggi dibandingkan ChatGPT.
Persentil tersebut didasarkan pada distribusi skor terbaru yang tersedia untuk peserta ujian dari setiap jenis ujian.
Dalam kasus ini, hasil ujian ChatGPT (GPT-3.5) dibandingkan dengan milik siswa/mahasiswa AS yang baru-baru ini mengikuti ujian yang sama.
Dari hasil pengujian, terlihat ChatGPT lemah dalam tiga kategori ujian, yaitu ujian bar, literatur Inggris, dan codeforses rating (programming).
ChatGPT mendapatkan skor di bawah 10 persentil untuk tiga kategori ujian tersebut.
Artinya, ada 90 persen peserta ujian lain yang memiliki skor lebih tinggi dibandingkan ChatGPT.
ChatGPT-4 lebih pintar dibanding ChatGPT
Pada Maret lalu, OpenAI resmi memperkenalkan AI language model baru, yaitu GPT-4.
GPT-4 ini akan menjadi suksesor dari GPT-3.5, model AI yang saat ini tertanam di chatbot ChatGPT.
• Apa itu Aplikasi Poe yang Ramai Dibahas di Media Sosial, Pesaing ChatGPT?
Sebagai suksesor, GPT-4 diklaim lebih cerdas dan dapat menjawab sejumlah pertanyaan dan perintah pengguna yang lebih kompleks dibanding GPT-3.5.