انتقاد پژوهشگر سابق OpenAI از داده برداری و نقض احتمالی قانون کپی رایت
به گزارش اخبار نجوم، سوچیر بالاجی، یکی از پژوهشگران سابق OpenAI که تا ماه آگوست 2024 در این شرکت مشغول به کار بوده است، اخیراً در انتقادی جدی علیه این شرکت گفت که OpenAI در فرآیند جمع آوری و استفاده از داده ها برای آموزش مدل های هوش مصنوعی خود، قوانین کپی رایت را نقض می کند.
بالاجی در ابتدا تصور می کرد که بخشی از یک پروژه تحقیقاتی فرق دارد و فکر نمی کرد که محصول نهایی به صورت چت بات و ابزارهای تولید تصویر عرضه شود. به گفته او، وقتی شما برای یک پروژه تحقیقاتی کار می کنید، استفاده از هر داده ای معمول است، اما این دیدگاه زمانی تغییر کرد که بالاجی به شکل نهایی محصول و استفاده از آن در مقیاس تجاری پی برد.
بالاجی، که فارغ التحصیل دانشگاه برکلی است، معتقد است که روش های فعلی داده برداری OpenAI، به ویژه برای محصولات عظیمی چون GPT-4 و DALL-E، بیشتر از آن که سودمند باشد، به اینترنت و جامعه آسیب می زند. او تأکید می کند که استفاده از این داده ها نه تنها ممکن است به منابع اطلاعاتی و خدمات اینترنتی آسیب برساند، بلکه تهدیدی برای حقوق نویسندگان، ناشران، و کاربران فردی محسوب می شود. به گفته او، اگر کسی با روش های OpenAI هم عقیده نباشد، باید شرکت را ترک کند؛ و او به همین دلیل نیز از این مجموعه جدا شده است.
OpenAI برای توسعه مدل های خود، از داده های عمومی موجود در وب استفاده می کند. شرکت اعلام کرده است که این کار را تحت اصول استفاده منصفانه (Fair Use) و مطابق با اصول حقوقی پذیرفته شده انجام می دهد. در بیانیه ای، OpenAI بیان کرده که استفاده از داده های عمومی برای آموزش مدل های هوش مصنوعی هم برای نوآوری و هم برای رقابت جهانی اهمیت دارد. با این حال، هنوز قانونی درباره استفاده منصفانه در زمینه آموزش هوش مصنوعی به تصویب نرسیده و OpenAI با شکایات متعددی روبه رو است، از جمله از سوی روزنامه هایی مانند نیویورک تایمز.
تبلیغ متنی
ویزای مولتی آلمان
-
علت و عوارض مشکل پزشکی از چیست؟
بالاجی بر این باور است که OpenAI در واقع داده های دارای کپی رایت را بدون اجازه جمع آوری و ترکیب می کند. او می گوید که خروجی های مدل های هوش مصنوعی این شرکت دقیقاً کپی شده از داده های اولیه نیستند، اما در عین حال اصالت و نوآوری کاملی هم ندارند و ترکیب و استفاده مجدد از داده های موجود را به عنوان نمونه ای از نقض قانون کپی رایت معرفی می کند. او برای حمایت از دیدگاه خود، تحلیل های ریاضی ای منتشر کرده و معتقد است که ترکیب داده ها و ارائه محصولات بر مبنای داده های قدیمی به نوعی نسخه برداری و ادغام غیرقانونی محسوب می شود.
در حال حاضر، بحث درباره استفاده منصفانه در حوزه هوش مصنوعی همچنان داغ است. با این که OpenAI و برخی دیگر از شرکت های فناوری استدلال می کنند که استفاده از داده های عمومی به طور کلی مجاز و قانونی است، مخالفان می گویند که استفاده بدون اجازه از محتواهای تحت کپی رایت، به حقوق نویسندگان و منابع اصلی آسیب می رساند. بالاجی از جمله کسانی است که معتقد است این شیوه برای اینترنت پایدار نیست و به اکوسیستم اطلاعاتی اینترنتی ضربه می زند. او این شیوه را غیرقانونی و مخالف اخلاق کسب وکار می داند.
منبع
petapixelمنبع: یک پزشک