OpenAI در حال راهاندازی یک عامل هوش مصنوعی همهکاره جدید در ChatGPT است که به گفته این شرکت میتواند طیف گستردهای از وظایف مبتنی بر رایانه را از طرف کاربران انجام دهد. OpenAI میگوید این عامل میتواند به طور خودکار در تقویم کاربر پیمایش کند، ارائهها و اسلایدشوهای قابل ویرایش ایجاد کند و کد را اجرا کند.
این ابزار که ChatGPT agent نام دارد، چندین قابلیت از ابزارهای agentic قبلی OpenAI، از جمله قابلیت Operator برای کلیک کردن روی وبسایتها و همچنین قابلیت Deep Research برای ترکیب اطلاعات از دهها وبسایت در یک گزارش تحقیقاتی مختصر را با هم ترکیب میکند. OpenAI میگوید کاربران میتوانند به سادگی با فراخوانی ChatGPT به زبان طبیعی با agent تعامل داشته باشند.
روز پنجشنبه، OpenAI ابزار ChatGPT را برای مشترکین طرحهای Pro، Plus و Team خود عرضه میکند. برای فعال کردن این ابزار، کاربران میتوانند در منوی کشویی ابزارهای ChatGPT، گزینه «حالت عامل» را انتخاب کنند.
راهاندازی عامل
راهاندازی عامل ChatGPT نشان دهنده جسورانهترین تلاش OpenAI تاکنون برای تبدیل ChatGPT به یک محصول عاملمحور است که میتواند به جای پاسخ دادن به سوالات، اقدامات لازم را انجام داده و وظایف را به کاربران واگذار کند. در سالهای اخیر، شرکتهای سیلیکون ولی از جمله OpenAI، گوگل و Perplexity دهها عامل هوش مصنوعی را رونمایی کردهاند که قول انجام همین کار را دادهاند. با این حال، این نسخههای اولیه عاملهای هوش مصنوعی در انجام وظایف پیچیده با مشکل مواجه شدهاند و به عنوان محصولات، نسبت به چشمانداز نهایی مدیران فناوری در مورد عاملهای هوش مصنوعی، جذابیت کمتری دارند.
با این اوصاف، OpenAI میگوید عامل ChatGPT بسیار توانمندتر از پیشنهادات قبلی این شرکت است.
عامل جدید OpenAI میتواند به رابطهای ChatGPT دسترسی داشته باشد و به کاربران اجازه میدهد برنامههایی مانند Gmail و GitHub را متصل کنند تا عامل بتواند اطلاعات مرتبط با درخواستهای شما را پیدا کند. علاوه بر این، OpenAI میگوید عامل ChatGPT به یک ترمینال دسترسی دارد و میتواند از APIها برای دسترسی به برنامههای خاص استفاده کند.
OpenAI پیشنهاد میکند که کاربران میتوانند از عامل ChatGPT برای «برنامهریزی و خرید مواد لازم برای تهیه صبحانه ژاپنی برای چهار نفر» و همچنین «تحلیل سه رقیب و ایجاد یک مجموعه اسلاید» استفاده کنند. این نوع قابلیتها مستلزم آن است که عامل ChatGPT وبسایتها را تجزیه و تحلیل کند، یک مسیر عملیاتی را برنامهریزی کند و از ابزارها استفاده کند – وظایفی بسیار پیچیدهتر از آنچه OpenAI قبلاً سعی کرده با عاملها انجام دهد.
طبق گفته OpenAI
مدل زیربنایی عامل ChatGPT، عملکرد پیشرفتهای را در چندین معیار ارائه میدهد.
این شرکت میگوید مدل عامل ChatGPT در آخرین آزمون Humanity (pass@1)، آزمونی دشوار متشکل از هزاران سوال در بیش از صد موضوع، امتیاز ۴۱.۶٪ را کسب کرده است. این تقریباً دو برابر امتیاز o3 و o4-mini شرکت OpenAI در این آزمون است.
در FrontierMath، یکی از سختترین بنچمارکهای ریاضی شناختهشده، OpenAI میگوید عامل ChatGPT وقتی به ابزارهایی مانند ترمینال برای اجرای کد دسترسی دارد، امتیاز ۲۷.۴٪ را کسب میکند. امتیاز قبلی مربوط به o4-mini بود که تنها ۶.۳٪ امتیاز کسب کرد.
OpenAI خاطرنشان میکند که عامل ChatGPT را با در نظر گرفتن ایمنی توسعه داده است، عمدتاً به این دلیل که این محصول قابلیتهای جدیدی را ارائه میدهد که میتواند آن را در دست یک عامل مخرب خطرناکتر کند. OpenAI پیش از این هشدار داده بود که مدلهای عامل میتوانند قابلیتهای خطرناکتری را ارائه دهند.
در گزارش ایمنی برای عامل ChatGPT، OpenAI میگوید که این مدل را به عنوان «قابلیت بالا» در حوزههای سلاحهای بیولوژیکی و شیمیایی طراحی کرده است، که در چارچوب آمادگی OpenAI به عنوان مدلی با قابلیت «تقویت مسیرهای موجود به آسیب شدید» تعریف شده است. OpenAI خاطرنشان میکند که شواهد مستقیمی از این موضوع ندارد، اما تصمیم گرفته است که رویکردی احتیاطی اتخاذ کند و اقدامات حفاظتی جدیدی را برای کاهش این خطرات فعال کند.
از جمله اقدامات حفاظتی جدید برای عامل ChatGPT میتوان به یک مانیتور اشاره کرد که همزمان با تعامل کاربران با محصول، به صورت بلادرنگ کار میکند. OpenAI میگوید که در هر درخواست وارد شده به عامل ChatGPT، یک طبقهبندیکننده اجرا میکند و تعیین میکند که آیا درخواست مربوط به زیستشناسی است یا خیر. در این صورت، OpenAI پاسخ عامل ChatGPT را از طریق یک مانیتور دوم اجرا میکند که تعیین میکند آیا محتوا میتواند برای ایجاد یک تهدید بیولوژیکی استفاده شود یا خیر.
اگرچه عامل ChatGPT چشمگیر به نظر میرسد، اما باید دید که عامل جدید OpenAI واقعاً در دنیای واقعی چقدر توانمند است. تاکنون، فناوری عامل در تعامل با دنیای واقعی نسبتاً شکننده بوده است. با این اوصاف، OpenAI معتقد است که مدل توانمندتری را توسعه داده است که قادر به تحقق وعدههای عاملهای هوش مصنوعی است