«اپن ای آی» کرالر وب خود را معرفی کرد
وب ادمینها این انتخاب را خواهند داشت تا با افزودن دستور کوتاهی به وبسایت خود، از کراول شدن خود توسط این ربات جلوگیری نمایند
شرکت «اپن ایآی» (OpenAI) – شرکت سازنده چت جیپیتی – ابزار خزنده وب (Web Crawler) خود با نام GPTBot را معرفی کرد. به گفته اپنایآی، نتایج خزش این ابزار میتواند مورد استفاده برای بهبود مدلهای زبانی این شرکت قرار گیرند.
به گزارش والکس و به نقل از Coin Telegraph، شرکت OpenAI در بلاگ تازهای که در وبسایت خود منتشر کرد افزود:
صفحات وبی که توسط ربات خزنده GPTBot مورد خزش قرار گیرد میتواند به شکل بالقوه برای بهبود مدلهای آتی مورد استفاده قرار گیرد.
نتایج این ربات میتواند سبب افزایش دقت و بهبود قابلیتهای مدلها شود.
یک خزنده وب نوعی ربات است که برای فهرست کردن وبسایتها سراسر اینترنت به کار میرود. موتورهای جستجو همچون گوگل و بینگ از این رباتها برای جمعآوری نتایج جستجوی کاربران بهره میبرند.
اپن ای آی افزود که این خزنده دادههای عمومی قابل دسترس در سطح وب را جمعآوری میکند اما صفحات پشت pay wall (محتوای پولی)، حاوی اطلاعات شخصی و یا نقضکننده سیاست محتوایی شرکت را از نتایج حذف خواهد کرد.
قابل ذکر است که مدیران وبسایتها میتوانند با افزودن دستور disallow (به فرم باکس زیر) از ایندکس شدن محتوای خود توسط این ربات جلوگیری کنند.
برای محدود کردن دسترسی GPTBot به سایت خود، دستور زیر را به فایل robots.txt به شکل زیر بیافزایید:
User-agent: GPTBot
Disallow: /
این ابزار جدید تنها سه هفته پس از فاش شدن درخواست اپن ایآی برای نشان تجاری GPT-5 منتشر شد. GPT-5 جانشین مدل فعلی این شرکت با نام GPT-4 خواهد شد.
طبق این درخواست که در تاریخ ۱۸ جولای به دفتر ثبت اختراع و نشان تجاری ایالات متحده رسید، واژه GPT-5 را چنین تعریف میکند: «نرمافزاری است که شامل گفتار و نوشتار به کمک هوش مصنوعی، تبدیل صوت به متن، تشخیص صدا و فراوری زبان و گفتار به کمک یادگیری ماشینی است.»
در ماه ژوئن، سم آلتمن (Sam Altman)، مدیر ارشد اجرایی شرکت OpenAI اعلام کرد که این شرکت هنوز با آغاز ترین داده برای مدل زبانی جدید خود (GPT-5) فاصله زیادی دارد. او افزود که بازبینیهای امنیتی فراوانی پیش از آغاز این فرایند باید صورت گیرد.
در این حین، نگرانیهای فراوانی در خصوص سیاستهای جمعآوری داده شرکت OpenAI ابراز شده است. حوزههای حقوق مولفین و رضایت صاحبان محتوا، مایه اصلی نگرانیهاست.
اخیرا کشور ژاپن به این شرکت در خصوص جمعآوری دادههای حساس هشدار داد و ایتالیا به شکل موقت استفاده از چت جی پی تی را پس از نقض قوانین حریم شخصی اتحادیه اروپا در ماه آوریل به حالت تعلیق درآورد.
در اواخر ماه ژوئن، پروندهای علیه شرکت اپن ایآی توسط ۱۶ شاکی به جریان افتاد. این شاکیان مدعی بودند که این شرکت فعال در حوزه هوش مصنوعی، به اطلاعات حساس کاربران دسترسی پیدا کرده است.
اگر این اتهامات ثابت شوند، OpenAI و مایکروسافت به دلیل نقض قوانین رایانهای به دردسر خواهند افتاد.