ChatGPT چیست؟
ChatGPT یک چت بات مدل زبان بزرگ است که توسط OpenAI بر اساس GPT-3.5 توسعه یافته است. توانایی قابل توجهی در تعامل در قالب گفتگوی محاوره ای و ارائه پاسخ هایی دارد که می تواند به طرز شگفت آوری انسانی به نظر برسد.
مدل های زبان بزرگ وظیفه پیش بینی کلمه بعدی را در یک سری کلمات انجام می دهند.
یادگیری تقویتی با بازخورد انسانی (RLHF) یک لایه آموزشی اضافی است که از بازخورد انسانی برای کمک به ChatGPT برای یادگیری توانایی پیروی از دستورالعملها و ایجاد پاسخهای رضایتبخش برای انسان استفاده میکند.
چه کسی ChatGPT را ساخت؟
ChatGPT توسط شرکت هوش مصنوعی OpenAI مستقر در سانفرانسیسکو ایجاد شده است. OpenAI Inc. شرکت مادر غیر انتفاعی OpenAI LP انتفاعی است.
OpenAI به دلیل معروف DALL·E خود، یک مدل یادگیری عمیق که تصاویر را از دستورالعمل های متنی به نام prompt تولید می کند، مشهور است.
مدیرعامل شرکت سام آلتمن است که قبلاً رئیس Y Combinator بود.
مایکروسافت شریک و سرمایه گذار به مبلغ 1 میلیارد دلار است. آنها به طور مشترک پلتفرم هوش مصنوعی Azure را توسعه دادند .
ChatGPT چگونه آموزش داده شد؟
GPT-3.5 بر روی حجم عظیمی از دادهها در مورد کد و اطلاعات از اینترنت، از جمله منابعی مانند بحثهای Reddit، آموزش داده شد تا به ChatGPT در یادگیری گفتگو و دستیابی به سبک انسانی پاسخدهی کمک کند.
ChatGPT همچنین با استفاده از بازخورد انسانی (تکنیکی به نام یادگیری تقویتی با بازخورد انسانی) آموزش داده شد تا هوش مصنوعی متوجه شود که انسان ها هنگام پرسیدن سوال چه انتظاراتی دارند. آموزش LLM به این روش انقلابی است زیرا فراتر از آموزش ساده LLM برای پیش بینی کلمه بعدی است.
در این قسمت میتوانید پاورپوینتی با حجم 250 مگابایت که شامل آشنایی و کار عملی با این چت بات می باشد را از حمید وب اپ دانلود کنید.
محدودیت های ChatGPT چیست؟
محدودیت در واکنش سمی
ChatGPT به طور خاص برنامه ریزی شده است تا پاسخ های سمی یا مضر ارائه نکند. بنابراین از پاسخ دادن به این نوع سوالات اجتناب خواهد کرد.
کیفیت پاسخ ها به کیفیت دستورالعمل ها بستگی دارد
یک محدودیت مهم ChatGPT این است که کیفیت خروجی به کیفیت ورودی بستگی دارد. به عبارت دیگر، دستورالعمل های متخصص (اعلانات) پاسخ های بهتری را ایجاد می کنند.
پاسخ ها همیشه درست نیستند
محدودیت دیگر این است که چون آموزش داده شده است تا پاسخ هایی را ارائه دهد که برای انسان ها درست باشد، پاسخ ها می توانند انسان را فریب دهند که خروجی درست است.
بسیاری از کاربران دریافتند که ChatGPT می تواند پاسخ های نادرستی ارائه دهد، از جمله برخی از آنها که به شدت نادرست هستند.
این را نمی دانستم، TIL pic.twitter.com/7yqJBB1lxS
— فیورا (@FioraAeterna) 5 دسامبر 2022
ناظران در وبسایت پرسش و پاسخ برنامهنویسی Stack Overflow ممکن است پیامدهای ناخواستهای از پاسخهایی که برای انسانها مناسب است، کشف کرده باشند.
Stack Overflow مملو از پاسخهای کاربران ایجاد شده از ChatGPT بود که به نظر درست میرسیدند، اما تعداد زیادی پاسخ اشتباه بودند.
OpenAI محدودیت های ChatGPT را توضیح می دهد
اعلامیه OpenAI این هشدار را ارائه کرد:
«ChatGPT گاهی اوقات پاسخ هایی با صدای معقول اما نادرست یا بی معنی می نویسد.
رفع این مشکل چالش برانگیز است، زیرا:
(1) در طول آموزش RL، در حال حاضر هیچ منبعی از حقیقت وجود ندارد.
(2) آموزش محتاط تر بودن مدل باعث می شود تا سوالاتی را که می تواند به درستی پاسخ دهد رد کند. و
(3) آموزش تحت نظارت مدل را گمراه می کند، زیرا پاسخ ایده آل به آنچه مدل می داند بستگی دارد تا آنچه نشان دهنده انسانی می داند.
آیا استفاده از ChatGPT رایگان است؟
استفاده از ChatGPT در حال حاضر در زمان “پیش نمایش تحقیق” رایگان است.
ربات چت در حال حاضر برای کاربران باز است تا بتوانند پاسخ ها را امتحان کنند و بازخورد ارائه کنند تا هوش مصنوعی بتواند در پاسخ به سؤالات بهتر شود و از اشتباهات خود درس بگیرد.
در اطلاعیه رسمی آمده است که OpenAI مشتاق دریافت بازخورد در مورد اشتباهات است:
“در حالی که ما تلاش کرده ایم تا مدل درخواست های نامناسب را رد کند، گاهی اوقات به دستورالعمل های مضر پاسخ می دهد یا رفتار مغرضانه ای از خود نشان می دهد.
ما از Moderation API برای هشدار یا مسدود کردن انواع خاصی از محتوای ناامن استفاده میکنیم، اما انتظار داریم فعلاً دارای نکات منفی و مثبت کاذب باشد.
ما مشتاق جمع آوری بازخورد کاربران برای کمک به کار مداوم خود برای بهبود این سیستم هستیم.”
در حال حاضر مسابقه ای با جایزه 500 دلاری در اعتبار ChatGPT وجود دارد تا مردم را تشویق کند که به پاسخ ها امتیاز دهند.
«کاربران تشویق میشوند تا درباره خروجیهای مدل مشکلساز از طریق UI، و همچنین در مورد مثبت/منفیهای نادرست از فیلتر محتوای خارجی که بخشی از رابط است، بازخورد ارائه کنند.
ما به ویژه به بازخورد در مورد خروجیهای مضری که ممکن است در دنیای واقعی و شرایط غیر خصمانه رخ دهد، و همچنین بازخوردی که به ما کمک میکند خطرات جدید و کاهشهای احتمالی را کشف و درک کنیم، علاقهمندیم.
میتوانید انتخاب کنید که در ChatGPT Feedback Contest3 شانس برنده شدن تا 500 دلار اعتبار API را انتخاب کنید.
ورودیها را میتوان از طریق فرم بازخوردی که در رابط ChatGPT پیوند داده شده است، ارسال کرد.»
مسابقه فعلی در ساعت 11:59 شب به وقت PST در 31 دسامبر 2022 به پایان می رسد.
نتیجه
همانطور که قبلا ذکر شد، ChatGPT به عنوان ابزاری در نظر گرفته شده است که در نهایت عموم باید برای استفاده از آن هزینه بپردازند.