lunchboxbanner

OpenAI از GPT 4 رونمایی کرد، ماه‌ها پس از ChatGPT دره سیلیکون حیرت‌زده

چهار ماه پیش، یک شرکت کوچک در سانفرانسیسکو با معرفی یک ربات گفتگوی آنلاین جدید که می‌توانست به سؤالات پیچیده پاسخ دهد، شعر بنویسد و حتی احساسات انسانی را تقلید کند، به بحث صنعت فناوری تبدیل شد.

اکنون این شرکت با نسخه جدیدی از فناوری که ربات‌های چت خود را تقویت می‌کند، بازگشته است. این سیستم در رقابت دره سیلیکون برای پذیرش هوش مصنوعی و تصمیم گیری نسل بعدی رهبران صنعت فناوری پیشرو خواهد بود.

OpenAI که حدود 375 کارمند دارد اما با میلیاردها دلار سرمایه گذاری از سوی مایکروسافت و افراد مشهور صنعت حمایت شده است، روز سه شنبه اعلام کرد که فناوری ای را منتشر کرده است که GPT-4 نامیده می شود. این موتور به گونه ای طراحی شده است که ربات های چت و انواع سیستم های دیگر، از موتورهای جستجو گرفته تا معلمان آنلاین شخصی را نیرو می دهد.

اکثر مردم از طریق نسخه جدیدی از چت ربات ChatGPT شرکت از این فناوری استفاده خواهند کرد، در حالی که مشاغل آن را در سیستم های مختلف، از جمله نرم افزارهای تجاری و وب سایت های تجارت الکترونیک، ترکیب می کنند. این فناوری در حال حاضر ربات چت را در دسترس تعداد محدودی از افراد با استفاده از موتور جستجوی بینگ مایکروسافت قرار می دهد.

پیشرفت OpenAI، تنها در عرض چند ماه، صنعت فناوری را در یکی از غیرقابل پیش بینی ترین لحظات خود در دهه های اخیر قرار داده است. بسیاری از رهبران صنعت بر این باورند که تحولات در هوش مصنوعی نشان دهنده یک تغییر اساسی در فناوری است، به همان اندازه که ایجاد مرورگرهای وب در اوایل دهه 1990 اهمیت دارد. این پیشرفت سریع دانشمندان کامپیوتر را متحیر کرده است.

GPT-4 که ​​مهارت‌های خود را با تجزیه و تحلیل حجم عظیمی از داده‌های جمع‌آوری‌شده از اینترنت می‌آموزد، به روش‌های مختلفی بر آنچه که ChatGPT اصلی را تامین می‌کرد، بهبود می‌بخشد. دقیق تر است. به عنوان مثال، می‌تواند آزمون یکنواخت وکالت را در اختیار بگیرد، بدهی مالیاتی افراد را بلافاصله محاسبه کند و توضیحات مفصلی از تصاویر ارائه دهد.

اما فناوری جدید OpenAI هنوز دارای برخی از کاستی‌های عجیب انسان‌مانند است که خودی‌های صنعت و افرادی را که با جدیدترین ربات‌های چت کار کرده‌اند را عصبانی کرده است. در برخی موضوعات متخصص و در برخی دیگر سخت گیر است. این می تواند در تست های استاندارد بهتر از بسیاری از افراد عمل کند و توصیه های پزشکی دقیقی را به پزشکان ارائه دهد، اما می تواند محاسبات اولیه را نیز به هم بزند.

شرکت‌هایی که آینده‌شان را روی این فناوری شرط‌بندی می‌کنند – حداقل در حال حاضر – ممکن است نادیده‌گیری را تحمل کنند، که در صنعتی که از ابتدا بر اساس این تصور ساخته شده بود که رایانه‌ها از خالقان انسانی‌شان دقیق‌تر هستند، مدت‌ها تابو بود.

سام آلتمن، مدیر اجرایی OpenAI در مصاحبه‌ای گفت: «نمی‌خواهم اینطور به نظر برسد که ما استدلال یا هوش را حل کرده‌ایم، که مطمئناً حل نکرده‌ایم». اما این یک گام بزرگ رو به جلو نسبت به آنچه در حال حاضر وجود دارد است.

سایر شرکت‌های فناوری احتمالاً ویژگی‌های GPT-4 را در مجموعه‌ای از محصولات و خدمات، از جمله نرم‌افزار مایکروسافت برای انجام وظایف تجاری و سایت‌های تجارت الکترونیکی که می‌خواهند روش‌های جدیدی را برای آزمایش مجازی محصولات خود به مشتریان ارائه دهند، بگنجانند. تعدادی از غول های صنعت مانند گوگل و شرکت مادر فیس بوک، متا نیز در حال کار بر روی چت بات های خود و فناوری هوش مصنوعی هستند.

ChatGPT و فناوری‌های مشابه در حال حاضر رفتار دانش‌آموزان و مربیانی را تغییر می‌دهند که تلاش می‌کنند بفهمند آیا این ابزارها باید در آغوش گرفته یا ممنوع شوند. از آنجایی که سیستم ها می توانند برنامه های کامپیوتری بنویسند و سایر وظایف تجاری را انجام دهند، در آستانه تغییر ماهیت کار نیز هستند.

حتی چشمگیرترین سیستم ها به جای جایگزینی کارگران ماهر، تمایل دارند که آنها را تکمیل کنند. این سیستم ها را نمی توان به جای پزشکان، وکلا یا حسابداران استفاده کرد. برای تشخیص اشتباهات آنها همچنان به متخصصان نیاز است. اما آنها به زودی می توانند جایگزین برخی از حقوقدانان شوند (که کار آنها توسط وکلای آموزش دیده بررسی و ویرایش می شود) و بسیاری از کارشناسان هوش مصنوعی معتقدند که آنها جایگزین کارگرانی خواهند شد که محتوا را در اینترنت تعدیل می کنند.

گرگ براکمن، رئیس OpenAI گفت: “قطعاً اختلالی وجود دارد، به این معنی که برخی از مشاغل از بین می روند و برخی مشاغل جدید ایجاد می شوند.” اما من فکر می کنم که اثر خالص این است که موانع ورود کاهش می یابد و بهره وری کارشناسان افزایش می یابد.

روز سه‌شنبه، OpenAI شروع به فروش دسترسی به GPT-4 کرد تا کسب‌وکارها و سایر توسعه‌دهندگان نرم‌افزار بتوانند برنامه‌های کاربردی خود را در بالای آن بسازند. این شرکت همچنین از این فناوری برای ساخت نسخه جدیدی از چت بات محبوب خود استفاده کرده است که برای هر کسی که دسترسی به ChatGPT Plus را خریداری کند در دسترس است – یک سرویس اشتراک با قیمت 20 دلار در ماه.

تعداد انگشت شماری از شرکت ها در حال حاضر با GPT-4 کار می کنند. مدیریت ثروت مورگان استنلی در حال ساخت سیستمی است که فوراً اطلاعات را از اسناد شرکت و سایر سوابق بازیابی می کند و آن را به مشاوران مالی در نثر محاوره ای ارائه می دهد. خان آکادمی، یک شرکت آموزش آنلاین، از این فناوری برای ایجاد یک معلم خصوصی استفاده می کند.

سال خان، مدیر اجرایی و بنیانگذار آکادمی خان، گفت: «این فناوری جدید می تواند بیشتر شبیه یک معلم خصوصی عمل کند. ما می‌خواهیم تکنیک‌های جدید را به دانش‌آموز آموزش دهد در حالی که دانش‌آموز بیشتر کار را انجام می‌دهد.»

مانند فن آوری های مشابه، سیستم جدید گاهی اوقات “توهم” می کند. بدون هشدار اطلاعات کاملا نادرست تولید می کند. در مورد وب‌سایت‌هایی که جدیدترین تحقیقات سرطان را ارائه می‌کنند، ممکن است چندین آدرس اینترنتی را ارائه دهد که وجود ندارند.

GPT-4 یک شبکه عصبی، نوعی سیستم ریاضی است که مهارت‌ها را با تجزیه و تحلیل داده‌ها یاد می‌گیرد. این همان فناوری است که دستیارهای دیجیتال مانند سیری برای تشخیص دستورات گفتاری و خودروهای خودران برای شناسایی عابران پیاده استفاده می کنند.

در حدود سال 2018، شرکت‌هایی مانند گوگل و OpenAI شروع به ساخت شبکه‌های عصبی کردند که از حجم عظیمی از متن دیجیتالی، از جمله کتاب‌ها، مقالات ویکی‌پدیا، گزارش‌های چت و سایر اطلاعات ارسال شده در اینترنت، درس می‌گرفتند. به آنها مدل های زبان بزرگ یا LLM می گویند

با مشخص کردن میلیاردها الگو در تمام آن متن، LLM ها یاد می گیرند که متن خود را تولید کنند، از جمله توییت ها، شعرها و برنامه های کامپیوتری. OpenAI داده های بیشتر و بیشتری را در LLM خود قرار داد.

OpenAI همچنین این فناوری را با استفاده از بازخورد آزمایش‌کنندگان انسانی اصلاح کرد. همانطور که مردم ChatGPT را آزمایش کردند، پاسخ‌های چت‌بات را رتبه‌بندی کردند و آن‌هایی را که مفید و صادق بودند از پاسخ‌های غیرمفید جدا کردند. سپس، با استفاده از تکنیکی به نام یادگیری تقویتی، سیستم ماه‌ها به تجزیه و تحلیل این رتبه‌بندی‌ها و به دست آوردن درک بهتری از آنچه باید و نباید انجام دهد، پرداخت.

لوک متز، محقق OpenAI می‌گوید: «انسان‌ها چیزهایی را که دوست دارند ببینند و کدام چیزها را دوست ندارند، ارزیابی می‌کنند.

ChatGPT اصلی بر اساس یک مدل زبان بزرگ به نام GPT-3.5 بود. GPT-4 OpenAI از مقادیر قابل توجهی داده یاد گرفت.

مدیران OpenAI از افشای میزان اطلاعاتی که چت ربات جدید از آن آموخته است خودداری کردند، اما آقای. براکمن گفت که مجموعه داده‌ها «مقیاس اینترنت» است، به این معنی که به اندازه کافی وب‌سایت‌ها را در بر می‌گیرد تا نمونه‌ای نماینده از همه انگلیسی‌زبانان در اینترنت ارائه کند.

قابلیت‌های جدید GPT-4 ممکن است برای افراد عادی که در ابتدا از این فناوری استفاده می‌کنند آشکار نباشد. اما احتمالاً به سرعت مورد توجه قرار می‌گیرند زیرا افراد عادی و متخصصان همچنان از این سرویس استفاده می‌کنند.

با توجه به یک مقاله طولانی از نیویورک تایمز و درخواست برای خلاصه کردن آن، ربات تقریباً هر بار یک خلاصه دقیق ارائه می دهد. چند جمله تصادفی به آن خلاصه اضافه کنید و از چت بات بپرسید که آیا خلاصه اصلاح شده دقیق است یا خیر، و به جملات اضافه شده به عنوان تنها نادرستی اشاره می کند.

آقای. آلتمن این رفتار را «استدلال» توصیف کرد. اما این فناوری نمی تواند استدلال انسان را تکرار کند. در تجزیه و تحلیل، خلاصه کردن و پاسخ به سؤالات پیچیده در مورد یک کتاب یا مقاله خوب است. اگر در مورد وقایعی که هنوز اتفاق نیفتاده اند از او بپرسند بسیار کمتر مهارت دارد.

می‌تواند یک جوک بنویسد، اما نشان نمی‌دهد که می‌داند واقعاً چه چیزی باعث خنده کسی می‌شود. اورن اتزیونی، مدیر اجرایی مؤسسه هوش مصنوعی آلن، آزمایشگاهی برجسته در سیاتل، می‌گوید: «این چیزهای خنده‌دار را درک نمی‌کند.

همانند فناوری‌های مشابه، کاربران ممکن است راه‌هایی برای ترغیب سیستم به رفتارهای عجیب و ترسناک بیابند. این نوع ربات که از او خواسته می شود از شخص دیگری تقلید کند یا یک بازیگر بازی کند، گاهی اوقات به سمت مناطقی که برای دوری از آن طراحی شده بود، منحرف می شود.

GPT-4 همچنین می تواند به تصاویر پاسخ دهد. با توجه به یک عکس، نمودار یا نمودار، این فناوری می‌تواند شرح مفصل و پاراگراف طولانی تصویر را ارائه دهد و به سؤالات مربوط به محتوای آن پاسخ دهد. این می تواند یک فناوری مفید برای افرادی باشد که دارای اختلال بینایی هستند.

در یک بعد از ظهر اخیر، آقای براکمن نشان داد که سیستم چگونه به تصاویر واکنش نشان می دهد. او به چت ربات جدید تصویری از تلسکوپ فضایی هابل داد و از آن خواست تا عکس را با جزئیات دقیق توصیف کند. با یک توضیح چهار پاراگراف پاسخ داد، که شامل توضیحی در مورد خط سفید اثیری بود که در سراسر عکس کشیده شده بود. چت بات نوشت: «ردی از ماهواره یا ستاره در حال تیراندازی».

مدیران OpenAI گفتند که این شرکت فوراً بخش توصیف تصویر این فناوری را منتشر نمی‌کند زیرا مطمئن نیستند که چگونه می‌توان از آن سوء استفاده کرد.

ساخت و ارائه ربات های چت بسیار گران است. چت ربات جدید OpenAI هزینه های شرکت را افزایش می دهد، از آنجایی که بر روی مقادیر بیشتری از داده ها آموزش دیده است. میرا موراتی، مدیر ارشد فناوری OpenAI، گفت که این شرکت می تواند دسترسی به این سرویس را در صورت ایجاد ترافیک بیش از حد کاهش دهد.

اما در درازمدت، OpenAI قصد دارد سیستم‌هایی بسازد که می‌توانند انواع مختلف رسانه‌ها، از جمله صدا و ویدئو و همچنین متن و تصویر را کنترل کنند.

ما می‌توانیم همه این مهارت‌های دانشی همه‌منظوره را به کار بگیریم و آن‌ها را در انواع حوزه‌های مختلف گسترش دهیم. براکمن گفت. “این فناوری را وارد یک حوزه کاملاً جدید می کند.”

Braylon Mccoy

محقق حرفه ای وب. پیشگام الکل متعصب تلویزیون دوست حیوانات در همه جا.

تماس با ما