۵ نشانهٔ بزرگ که ثابت میکند متن توسط هوش مصنوعی نوشته شده است

به طور خلاصه
مدلها سواد جدید و محتاطانهای را برانگیختهاند: مردم اکنون میتوانند یک پاراگراف را بخوانند و تعجب کنند که چه کسی—یا چه چیزی—آن را نوشته است. این اضطراب به دلیلی خوب وجود دارد.
مطالعات اخیر همچنان نشان میدهند که سیلاب همیشهرو به رشد نثر تولیدشده توسط ماشین، به روشهایی که به طور فزایندهای چندان نامحسوس نیستند، از انتخاب کلمات خاص گرفته تا تیکهای ساختاری به راحتی قابل شناسایی، با نوشتار انسان متفاوت است. این الگوها مهم هستند زیرا بر چیزی بسیار فراتر از انشاهای مدرسه و پایاننامههای تحقیقاتی تأثیر میگذارند؛ آنها ارتباطات شرکتی، روزنامهنگاری و ایمیلهای بینفردی را به روشهایی شکل میدهند که میتوانند اعتماد یا اصالت را مخدوش کنند.
محققانی که تکنیکهای تشخیص سبکسنجی را بررسی کردهاند، الگوهای قابل اندازهگیری و سازگاری در تنوع واژگانی، ساختار بند و توزیع کلمات تابع—یک اثر انگشت آماری که در طول وظایف و دستورالعملها باقی میماند—یافتهاند. در حالی که این نشانهها با هر نسل مدل در حال کوچکشدن هستند—برای مثال، OpenAI به تازگی وابستگی بیش از حد خود به خط تیره را برطرف کرده است—تفاوت بین تولیدات سطحی هوش مصنوعی و چیزهایی که انسان
تحلیل اخیر واشنگتن پست از ۳۲۸,۷۴۴ پیام چتجیپیتی این نکته را با دادههای واقعی تقویت میکند. این تحلیل نشان داد که مدل به شدت به ایموجیها، طیف محدودی از کلمات مورد علاقه و آن نشانه محبوب همه، یعنی «توازی منفی» متکی است: «این X نیست، Y است» یا «کمتر به X مربوط است و بیشتر به Y».
واشنگتن پست همچنین در برابر اعتمادبهنفس بیش از حد هشدار داد: هیچیک از این ویژگیها اثباتکننده نویسندگی هوش مصنوعی نیستند؛ آنها فقط احتمال را افزایش میدهند. با این حال، وقتی یک نوشته چندین مورد از آنها را نشان میدهد، نادیده گرفتن این سیگنال دشوارتر میشود.
در ادامه پنج قویترین سیگنال که نشان میدهد یک متن ممکن است توسط ماشین تولید شده باشد، هر کدام مبتنی بر پژوهشهای فعلی، آورده شدهاند.
5 نشانه رایج متون تولیدشده توسط هوش مصنوعی
-
تضاد منفی و تقابل بیش از حد سادهشده
هوش مصنوعی به شکل افراطی از ساختارهای نمایشی و مرتبی مانند «این X نیست، Y است» و شکل مشابه آن یعنی «نه فقط X، بلکه Y» استفاده میکند. این ساختارها توهم بینش ایجاد میکنند در حالی که محتوای بسیار کمی ارائه میدهند. مطالعات سبکسنجی نشان میدهد که خروجی مدلهای زبانی بزرگ به سمت ساختارهای جملهای متعادل و فرمولیگرا تمایل دارد، نه ریتمهای نامتعادل و شهودی که نویسندگان انسانی به کار میبرند. در مجموعه داده واشنگتن پست، انواع مختلف ساختار «نه فقط X، بلکه Y» به تنهایی در حدود ۶ درصد از تمام پیامهای ماه ژوئیه ظاهر شد – درصد شگفتآوری برای یک ویژگی سبکی واحد.
-
ساختار بیش از حد منظم و ریتم قابل توجه یکنواخت
متون تولیدشده توسط مدلهای زبانی بزرگ اغلب طوری به نظر میرسند که گویی توسط کسی نوشته شدهاند که به شکلی وسواسگونه متن را بازنویسی میکند اما هرگز بداههپردازی نمیکند. پاراگرافها از الگوهای کتابدرسی پیروی میکنند.
طبق یک تحلیل اخیر در نشریه Nature، انتقالها بدون اصطکاک هستند و ضربآهنگ تقریباً بهطور ریاضی یکنواخت است. نوشتار انسان — حتی نوشتار دقیق — معمولاً حاوی انحرافها، وقفهها، تغییرات لحنی و سرعتهای نامتقارن است. کارهای سبکسنجی که خروجی مدلهای زبانی بزرگ را با داستانهای کوتاه انسانی مقایسه میکنند، نشان میدهند که این مدلها واریانس بسیار کمتری در طول جملات و شکل نحوی نشان میدهند.