Obrolan gpt

ChatGPT menunjukkan tanda-tanda “malas”

Avatar Alexandre Marques
Pengguna melaporkan bahwa AI menolak melakukan tugas dan menolak tanggapan pengguna, seolah-olah AI tidak tertarik untuk membantu. OpenAI mengonfirmasi bahwa mereka sedang menyelidiki kasus ini.

Jika Anda menggunakan ChatGPT untuk melaksanakan tugas-tugas profesional, ada kemungkinan Anda akan dibiarkan tanpa melaksanakannya. Kamis lalu, OpenAI diungkapkan di jaringannya bahwa mereka sedang menyelidiki laporan bahwa alat AI mulai menolak permintaan pengguna, menunjukkan bahwa mereka harus melakukan tugas sendiri atau dengan tegas menolak untuk menyelesaikannya. Permasalahan yang ada di ChatGPT agak diharapkan, mengingat AI bisa membuat kesalahan, tapi ini akan menjadi kasus a ChatGPT "lelah".

Sejak diluncurkan, ChatGPT telah diakui sebagai alat inovatif untuk mengoptimalkan tugas di tempat kerja. Diperkirakan AI telah memperoleh basis pengguna sebesar 1,7 miliar, menurut nomor dari Web Serupa. Pengenalan alat ini ke pasar kerja adalah sebuah kenyataan, menurut survei Reuters/Ipsos, yang dilakukan pada bulan Agustus, sekitar 28% dari 2.625 responden (profesional perkantoran di AS) mengungkapkan bahwa mereka menggunakan alat ini secara teratur dalam aktivitas profesional mereka. Hanya 22% yang mengatakan bahwa perusahaan mereka secara eksplisit mengizinkan penggunaan alat eksternal ini.

Laporan kesulitan dengan kesalahan ChatGPT

Malas ngobrol.
Pengguna mengeluh tentang layanan ChatGPT di media sosial dan, khususnya, di Reddit. Foto: Reproduksi/Jornal da Band.

Pengguna mengungkapkan ketidakpuasannya dengan tanggapan kurang ajar dari bot, yang seharusnya membuat tugas Anda lebih mudah. Beberapa pengusaha, eksekutif teknologi, dan profesional mengatakan bahwa model bahasa tingkat lanjut OpenAI, sebagai GPT-4, mulai menolak menanggapi permintaan tertentu. Sebaliknya, mereka memberikan instruksi kepada orang-orang tentang cara menyelesaikan tugas mereka sendiri.

Contohnya terjadi ketika Matthew Wensing, seorang pendiri startup, meminta GPT-4 untuk membuat daftar tanggal kalender yang akan datang. Bot awalnya menyarankan agar dia mencoba menggunakan alat lain untuk menemukan jawabannya. Pada kesempatan lain, ketika meminta chatbot untuk menghasilkan sekitar 50 baris kode, responsnya menyertakan contoh yang dapat digunakan Wensing sebagai model untuk menyelesaikan tugas tanpa bantuan AI, seperti yang dibagikan Wensing dalam tangkapan layar X.

Di Reddit, pengguna juga melaporkan sulitnya mendapatkan ChatGPT merespons tugas yang diberikan dengan tepat, mengharuskan Anda bergantian di antara beberapa perintah hingga Anda mencapai respons yang diinginkan. Banyak keluhan berpusat pada kemampuan ChatGPT dalam menulis kode, dan beberapa menyatakan keinginan agar perusahaan kembali ke model GPT asli. Selain itu, pengguna menunjukkan bahwa kualitas tanggapan juga menurun.

Masih di bulan Juli tahun ini, sebuah studi yang dilakukan oleh para peneliti di Stanford dan UC Berkeley menunjukkan bahwa kemampuan AI sedang menurun. Para peneliti melakukan analisis sistematis terhadap berbagai versi ChatGPT, mengembangkan tolok ukur yang ketat untuk menilai kompetensi model dalam tugas matematika, pengkodean, dan penalaran visual.

Dalam tantangan matematika untuk mengidentifikasi bilangan prima, ChatGPT itu memiliki akurasi 97,6%, menyelesaikan 488 dari 500 pertanyaan dengan benar di bulan Maret. Namun, pada bulan Juni, akurasinya turun menjadi 2,4%, dengan hanya 12 pertanyaan yang dijawab dengan benar. Penurunan ini terutama terlihat pada keterampilan pengkodean perangkat lunak chatbot. Studi tersebut menyimpulkan bahwa, untuk GPT-4, persentase respons yang dapat dieksekusi secara langsung turun dari 52% pada bulan Maret menjadi 10% pada bulan Juni, tanpa menggunakan plugin interpretasi kode.

Apa yang menjelaskan masalah ChatGPT?

Malas ngobrol.
ChatGPT belum diperbarui sejak 11 November. Foto: Jonathan Kemper/Unsplash.

Di beberapa thread di Reddit dan bahkan di postingan di forum pengembang perusahaan itu sendiri OpenAI, pengguna menyatakan ketidakpuasannya, melaporkan bahwa sistem menjadi kurang berguna. Selain itu, ada spekulasi bahwa perubahan ini disengaja oleh pihak tersebut OpenAI, bertujuan untuk menghemat upaya dan sumber daya keuangan dalam investasi di ChatGPT.

Hal ini disebabkan meskipun hanya menghasilkan beberapa paragraf teks, namun memberikan jawaban yang lebih luas memerlukan jumlah penelitian yang lebih banyak sehingga memakan daya komputasi yang lebih besar. Pengoperasian sistem ini dinilai memakan biaya besar bagi perusahaan pemiliknya.


Meskipun kelelahan akibat kecerdasan buatan masih terjadi, pengguna telah menemukan cara mereka sendiri untuk memulihkan fungsi normal platform melalui petunjuk tertentu. Menariknya, menanyakan ChatGPT untuk “mengambil napas dalam-dalam” dan instruksi yang hanya memberikan respons yang lengkap dan akurat tampaknya efektif.

Permintaan lain juga disebut-sebut sebagai cara untuk mengarahkan AI ke format yang lebih asertif. Permintaan, misalnya, agar ChatGPT hanya menjawab jika Anda memiliki pengetahuan tentang subjek tersebut, atau meminta mereka mengajukan pertanyaan tambahan untuk memahami konteksnya, akan membantu meningkatkan jawaban. Hal yang sama berlaku untuk meminta penjelasan langkah demi langkah atau menginstruksikan sistem untuk menghindari penghematan token dalam memberikan hasil.

Meskipun OpenAI belum mengonfirmasi bahwa perintah tersebut dapat menyelesaikan masalah, laporan dari pengguna di media sosial menunjukkan bahwa perintah tersebut mungkin efektif. Sementara itu, kita hanya perlu menunggu pembaruan model AI berikutnya yang memberikan solusi pasti untuk masalah tersebut. ChatGPT dengan kemalasan.

Apa yang OpenAI katakan tentang “ChatGPT yang lelah”

Masalah dengan obrolangpt.
CEO OpenAI, Sam Altamn, mengalami krisis di perusahaan ketika dia dipecat dan dipekerjakan kembali dalam beberapa hari. Foto: Reproduksi/Epoca.

Setelah melalui krisis baru-baru ini dengan hak untuk “kursi musik” yang melibatkan CEO-nya, Sam Altamn, Sebuah OpenAI, melalui akun ChatGPT di X, mengumumkan bahwa mereka sedang mencari masukan mengenai modelnya yang tampaknya “semakin malas”. Perusahaan mengklarifikasi bahwa mereka belum memperbarui model tersebut sejak 11 November dan menyatakan bahwa ini tidak disengaja:

Kami mendengar semua komentar Anda tentang GPT4 yang semakin malas! Kami belum memperbarui model tersebut sejak 11 November dan hal tersebut tentunya tidak disengaja. Perilaku model tidak dapat diprediksi dan kami mencoba memperbaikinya

Meskipun beberapa karyawan mengaitkan beberapa masalah tersebut dengan bug perangkat lunak, namun Buka sebuahSaya melaporkan pada hari Sabtu bahwa mereka terus menyelidiki keluhan pengguna. Dalam postingan online lainnya, perusahaan menjelaskan bahwa pelatihan model obrolan bukanlah proses industri yang bersih. Lihat pernyataan:

Pelatihan model obrolan bukanlah proses industri yang bersih. Pelatihan yang berbeda, meskipun menggunakan kumpulan data yang sama, dapat menghasilkan model yang sangat berbeda dalam hal kepribadian, gaya penulisan, perilaku tidak ikut serta, kinerja penilaian, dan bahkan bias politik. Saat meluncurkan model baru, kami melakukan pengujian menyeluruh pada metrik evaluasi offline dan pengujian A/B online. Setelah menerima semua hasil ini, kami mencoba membuat keputusan berdasarkan data mengenai apakah model baru ini merupakan peningkatan dibandingkan model sebelumnya untuk pengguna sebenarnya.

Proses ini tidak seperti memperbarui situs web dengan fitur baru dan lebih seperti upaya artisanal oleh beberapa orang untuk merencanakan, membuat, dan mengevaluasi model obrolan baru dengan perilaku baru! Kami selalu berupaya menjadikan model kami lebih mampu dan berguna bagi semua orang di jutaan kasus penggunaan. Jadi tolong terus berikan komentarnya! Hal ini membantu kita tetap menyadari masalah evaluasi dinamis ini.

Analogi yang digunakan adalah bahwa proses ini kurang mirip dengan memperbarui situs web dengan fitur baru dan lebih mirip dengan upaya kerajinan yang melibatkan beberapa orang untuk merencanakan, membuat, dan mengevaluasi model obrolan baru dengan perilaku berbeda. Himbauan tersebut dibuat agar pengguna terus memberikan masukan, karena hal ini dapat membantu perusahaan menghadapi tantangan dalam mengevaluasi modelnya.

Lihat juga:

Fontes: Bisnis Insider, Independen e Techradar

Diperiksa oleh Glaucon Vital pada 12/12/23.


Temukan lebih lanjut tentang Showmetech

Daftar untuk menerima berita terbaru kami melalui email.

Pos terkait