جدیدترین مدل چتجیپیتی عرضه شد
شرکت «اوپنایآی» مدل جدید GPT-5.4 را عرضه کرد.
«اوپنایآی»(OpenAI) روز پنجشنبه مدل GPT-5.4 را منتشر کرد که یک مدل بنیادین جدید است و به عنوان توانمندترین و کارآمدترین مدل مرزی این شرکت برای کار حرفهای معرفی شده است.
به نقل از تک کرانچ، علاوه بر نسخه استاندارد، GPT-5.4 به عنوان یک مدل استدلالی در نسخه Thinking یا بهینهسازیشده برای عملکرد بالا در نسخه Pro نیز در دسترس است.
نسخه API این مدل با پنجرههای متنی به بزرگی یک میلیون توکن در دسترس خواهد بود که بزرگترین پنجره متنی اوپنایآی تا به امروز است.
همچنین، اوپنایآی بر بهبود کارآیی توکنها تأکید کرد و گفت GPT-5.4 توانسته مشکلات مشابه را با توکنهای بسیار کمتری نسبت به نسخه پیشین خود حل کند.
مدل جدید با نتایج قابل توجهی همراه بوده است که از جمله آنها میتوان به امتیازات بیسابقه در معیارهای OSWorld-Verified و WebArena Verified اشاره کرد. مدل جدید در آزمون GDPval شرکت اوپنایآی برای وظایف مربوط به دانش نیز امتیاز بیسابقه ۸۳ درصد را به دست آورد.
مدل GPT-5.4 تلاشهای اوپنایآی را برای محدود کردن توهمات و خطاها نشان میدهد. اوپنایآی اعلام کرد که مدل جدید در مقایسه با GPT 5.2 تا ۳۳ درصد کمتر در ادعاهای فردی خطا میکند و پاسخهای کلی آن ۱۸ درصد کمتر احتمال دارد حاوی خطا باشند.
به عنوان بخشی از این رونمایی، اوپنایآی نحوه مدیریت تعامل با برنامههای بیرونی توسط API مدل GPT-5.4 را تغییر داده و سیستم جدیدی را به نام Tool Search معرفی کرده است. پیش از این، پیامهای سیستم تعاریفی را برای همه ابزارهای موجود ارائه میدادند؛ فرآیندی که با افزایش تعداد ابزارهای موجود میتوانست توکنهای زیادی را مصرف کند. سیستم جدید به مدلها امکان میدهد تا در صورت نیاز، تعاریفی را جستوجو کنند و در نتیجه، درخواستها در سیستمهایی با ابزارهای زیاد، سریعتر و ارزانتر انجام شود.
همچنین، اوپنایآی یک ارزیابی ایمنی جدید را برای آزمایش زنجیره فکری مدلهای خود در نظر گرفته که تفسیر جاری ارائهشده توسط مدلها برای نشان دادن فرآیند تفکر از طریق وظایف چند مرحلهای است. پژوهشگران ایمنی هوش مصنوعی مدتهاست نگران این هستند که مدلهای استدلالی ممکن است زنجیره فکری خود را به اشتباه نشان دهند و آزمایشها ثابت میکنند که این اتفاق امکان دارد در شرایط مناسب رخ دهد.
ارزیابی جدید اوپنایآی نشان میدهد احتمال فریب در نسخه Thinking مدل GPT-5.4 کمتر است که نشان میدهد این مدل توانایی پنهان کردن استدلال خود را ندارد و نظارت زنجیره فکری همچنان یک روش ایمنی مؤثر است.
در وبسایت اوپنایآی آمده است: GPT‑5.4 بهترین پیشرفتهای اخیر ما را در استدلال، کدنویسی و گردشهای کاری عاملمحور در یک مدل واحد گرد هم آورده است. این مدل، قابلیتهای کدنویسی پیشرو در صنعت GPT‑5.3‑Codex را در خود جای داده و در عین حال، نحوه عملکرد مدل را در ابزارها، محیطهای نرمافزاری و وظایف حرفهای شامل صفحات گسترده، ارائهها و اسناد بهبود میبخشد. نتیجه، مدلی است که کارهای واقعی پیچیده را به طور دقیق، مؤثر و کارآمد انجام میدهد.