۵ نشانهٔ بزرگ که ثابت میکند متن توسط هوش مصنوعی نوشته شده است

27 آبان 1404آخرین بروزرسانی: 26 آبان 1404

به طور خلاصه

مطالعات سبک‌سنجی جدید، الگوهای تکرارشونده در نثر هوش مصنوعی را شناسایی می‌کنند؛ از جمله ریتم قابل پیش‌بینی، احساسات یکنواخت و تنوع واژگانی کم.
تحلیل واشنگتن پست از ۳۲۸,۷۴۴ پیام چت‌جی‌پی‌تی، وابستگی شدید به ایموجی‌ها، کلمات مورد علاقه و عبارت کلیشه‌ای «نه فقط X، بلکه Y» را نشان می‌دهد.
علائم واژگانی به سرعت تکامل می‌یابند، اما عادات ساختاری مانند تقارن، منظم‌بودن و توازی منفی در نسل‌های مختلف مدل باقی می‌مانند.

آیا این روزها همه چیز توسط هوش مصنوعی نوشته می‌شود؟ آیا این مقاله هم همینطور است؟

تکثیر گسترده مدل‌های زبانی

مدل‌ها سواد جدید و محتاطانه‌ای را برانگیخته‌اند: مردم اکنون می‌توانند یک پاراگراف را بخوانند و تعجب کنند که چه کسی—یا چه چیزی—آن را نوشته است. این اضطراب به دلیلی خوب وجود دارد.

مطالعات اخیر همچنان نشان می‌دهند که سیلاب همیشه‌رو به رشد نثر تولیدشده توسط ماشین، به روش‌هایی که به طور فزاینده‌ای چندان نامحسوس نیستند، از انتخاب کلمات خاص گرفته تا تیک‌های ساختاری به راحتی قابل شناسایی، با نوشتار انسان متفاوت است. این الگوها مهم هستند زیرا بر چیزی بسیار فراتر از انشاهای مدرسه و پایان‌نامه‌های تحقیقاتی تأثیر می‌گذارند؛ آن‌ها ارتباطات شرکتی، روزنامه‌نگاری و ایمیل‌های بین‌فردی را به روش‌هایی شکل می‌دهند که می‌توانند اعتماد یا اصالت را مخدوش کنند.

محققانی که تکنیک‌های تشخیص سبک‌سنجی را بررسی کرده‌اند، الگوهای قابل اندازه‌گیری و سازگاری در تنوع واژگانی، ساختار بند و توزیع کلمات تابع—یک اثر انگشت آماری که در طول وظایف و دستورالعمل‌ها باقی می‌ماند—یافته‌اند. در حالی که این نشانه‌ها با هر نسل مدل در حال کوچک‌شدن هستند—برای مثال، OpenAI به تازگی وابستگی بیش از حد خود به خط تیره را برطرف کرده است—تفاوت بین تولیدات سطحی هوش مصنوعی و چیزهایی که انسان

تحلیل اخیر واشنگتن پست از ۳۲۸,۷۴۴ پیام چت‌جی‌پی‌تی این نکته را با داده‌های واقعی تقویت می‌کند. این تحلیل نشان داد که مدل به شدت به ایموجی‌ها، طیف محدودی از کلمات مورد علاقه و آن نشانه محبوب همه، یعنی «توازی منفی» متکی است: «این X نیست، Y است» یا «کمتر به X مربوط است و بیشتر به Y».

واشنگتن پست همچنین در برابر اعتمادبه‌نفس بیش از حد هشدار داد: هیچ‌یک از این ویژگی‌ها اثبات‌کننده نویسندگی هوش مصنوعی نیستند؛ آن‌ها فقط احتمال را افزایش می‌دهند. با این حال، وقتی یک نوشته چندین مورد از آن‌ها را نشان می‌دهد، نادیده گرفتن این سیگنال دشوارتر می‌شود.

در ادامه پنج قوی‌ترین سیگنال که نشان می‌دهد یک متن ممکن است توسط ماشین تولید شده باشد، هر کدام مبتنی بر پژوهش‌های فعلی، آورده شده‌اند.

5 نشانه رایج متون تولیدشده توسط هوش مصنوعی

تضاد منفی و تقابل بیش از حد ساده‌شده

هوش مصنوعی به شکل افراطی از ساختارهای نمایشی و مرتبی مانند «این X نیست، Y است» و شکل مشابه آن یعنی «نه فقط X، بلکه Y» استفاده می‌کند. این ساختارها توهم بینش ایجاد می‌کنند در حالی که محتوای بسیار کمی ارائه می‌دهند. مطالعات سبک‌سنجی نشان می‌دهد که خروجی مدل‌های زبانی بزرگ به سمت ساختارهای جمله‌ای متعادل و فرمولی‌گرا تمایل دارد، نه ریتم‌های نامتعادل و شهودی که نویسندگان انسانی به کار می‌برند. در مجموعه داده واشنگتن پست، انواع مختلف ساختار «نه فقط X، بلکه Y» به تنهایی در حدود ۶ درصد از تمام پیام‌های ماه ژوئیه ظاهر شد – درصد شگفت‌آوری برای یک ویژگی سبکی واحد.
ساختار بیش از حد منظم و ریتم قابل توجه یکنواخت

متون تولیدشده توسط مدل‌های زبانی بزرگ اغلب طوری به نظر می‌رسند که گویی توسط کسی نوشته شده‌اند که به شکلی وسواس‌گونه متن را بازنویسی می‌کند اما هرگز بداهه‌پردازی نمی‌کند. پاراگراف‌ها از الگوهای کتاب‌درسی پیروی می‌کنند.

طبق یک تحلیل اخیر در نشریه Nature، انتقال‌ها بدون اصطکاک هستند و ضرب‌آهنگ تقریباً به‌طور ریاضی یکنواخت است. نوشتار انسان — حتی نوشتار دقیق — معمولاً حاوی انحراف‌ها، وقفه‌ها، تغییرات لحنی و سرعت‌های نامتقارن است. کارهای سبک‌سنجی که خروجی مدل‌های زبانی بزرگ را با داستان‌های کوتاه انسانی مقایسه می‌کنند، نشان می‌دهند که این مدل‌ها واریانس بسیار کمتری در طول جملات و شکل نحوی نشان می‌دهند.

ملایم‌سازی بیش از حد لحن عاطفی و محافظه‌کاری افراطی

هوش مصنوعی تمایل دارد به گونه‌ای دوستانه به نظر برسد که هیچ فرد بزرگسالی واقعاً این‌گونه صحبت نمی‌کند، مگر اینکه در بخش منابع انسانی یا پشتیبانی از مشتری کار کند. عباراتی مانند «قابل درک است که…» یا پایان‌بندی‌هایی که همه چیز را به آرامی خلاصه می‌کنند («در نهایت…») با نظمی غیرطبیعی ظاهر می‌شوند. مرورهای کمی روش‌های تشخیص خاطرنشان می‌کنند که نثر تولیدشده توسط مدل‌های زبانی بزرگ، احساسات یکنواخت‌تر و تعدیل‌های عاطفی ناگهانی کمتری را نسبت به متن انسانی نشان می‌دهد.
انتزاعات مبهم و واژگان «ایمن» در حال تحول

مدل‌ها به شدت به اسم‌های کلی—«اکوسیستم»، «چارچوب»، «پویا»—و افعالی مانند «اهرم‌سازی»، «آزادسازی» یا «پیمودن» متکی هستند وقتی که از جزئیات خالی می‌شوند. مطالعات به طور مداوم تنوع لغوی کمتر و اسم‌سازی سنگین‌تر را در متن‌های هوش مصنوعی نشان می‌دهند. تحلیل‌های واشنگتن پست و نیچر همچنین دریافتند که برخی کلیشه‌های هوش مصنوعی ثابت نیستند: «کاوش» بدنام عمدتاً محو شده و با favorites جدیدی مانند «هسته‌ای» و «مدرن» جایگزین شده است. این موضوع اهمیت دارد زیرا سبک‌های واژگانی به سرعت تکامل می‌یابند؛ ساختار قابل اطمینان‌تر از هر فهرست ثابت کلمات است.

بندهای متعادل و عبارت‌بندی به طور آشکار محتاطانه

مدل‌های زبانی بزرگ عاشق تقارن هستند: «در حالی که X درست است، Y نیز مهم است»، یا «چه یک مبتدی باشید چه یک متخصص…». این ساختارها امن به نظر می‌رسند زیرا از تعهد اجتناب می‌کنند. مطالعات سبک‌سنجی نشان می‌دهند که متن هوش مصنوعی الگوهای خاصی از کلمات تابع و ساختارهای بندی را با نرخی که به شدت با خطوط پایه انسانی متفاوت است، بیش از حد استفاده می‌کند. انسان‌ها تمایل دارند که یا موجزتر باشند یا پرگویی بیشتری داشته باشند؛ ماشین‌ها هر بار هدفشان تعادل دیپلماتیک است.

راستی، بیشتر این مقاله توسط هوش مصنوعی نوشته شده است.

Generally Intelligent

یک سفر هفتگی هوش مصنوعی که توسط Gen، یک مدل هوش مصنوعی تولیدی، روایت می‌شود.

27 آبان 1404آخرین بروزرسانی: 26 آبان 1404

مشاهده بیشتر

۵ نشانهٔ بزرگ که ثابت میکند متن توسط هوش مصنوعی نوشته شده است

به طور خلاصه

Generally Intelligent

دیدگاهتان را بنویسید لغو پاسخ

سهام ماینر بیت‌کوین «هایو» پس از درآمد بی‌سابقه در سهماهه دوم و قرارداد هوش مصنوعی رشد کرد

دونالد ترامپ: جانشین جروم پاول برای ریاست فدرال رزرو را انتخاب کرده‌ام

السالوادور ۱۰۰ میلیون دلار در بیت‌کوین سرمایه‌گذاری کرد در حالی که بازار سقوط کرد

بررسی نظرات بنیانگذاران هوش مصنوعی پیش‌بینی می‌کند: «پِرپلکسیتی» مستعدترین غول هوش مصنوعی برای شکست است.