مروری بر نقش هوش مصنوعی در رسانههای خبری
هوش مصنوعی؛ عضو جدید تحریریهها
با فراگیری هوش مصنوعی مولد، پای آن به رسانههای خبری هم باز شده است. پژوهشی تازه نشان میدهد که از زمان انتشار «ChatGPT» در سال ۲۰۲۲، استفاده از مدلهای زبانی بزرگ در تولید خبر بهویژه در رسانههای محلی و دانشگاهی جهش چشمگیری داشته است؛ روندی که هم فرصتهایی برای روانتر شدن متنها فراهم کرده و هم نگرانیهایی درباره شفافیت و اعتماد مخاطبان برانگیخته است. در همین راستا، مقالهای جدید با عنوان «پژواکهای خودکارسازی: افزایش استفاده از مدلهای زبانی بزرگ در خبرنگاری» به بررسی حضور و تأثیر هوش مصنوعی مولد در حوزه رسانه و روزنامهنگاری پرداخته است. نویسندگان این اثر پژوهشی با تحلیل بیش از ۴۰ هزار مقاله از رسانههای بزرگ، محلی و دانشگاهی در بازه زمانی سالهای ۲۰۲۰ تا ۲۰۲۴ نشان میدهند که پس از انتشار عمومی «ChatGPT»، میزان استفاده از مدلهای زبانی بزرگ در تولید خبر به شکل قابلتوجهی افزایش یافته است.
به گزارش زاویه؛ این روند در رسانههای کوچکتر (محلی و دانشگاهی) شدیدتر بوده و بیش از همه در بخشهای ابتدایی متنهای خبری دیده میشود. پژوهش همچنین نشان میدهد که محتوای خبری تولید شده توسط هوش مصنوعی معمولاً خواناتر و غنیتر است اما میزان تنوع و سبک انسانی را کمتر دارد.
پژوهشگران در طراحی تحقیق خود، دو منبع داده ساختند تا هم «زمان و مکان» و هم «چگونگی» استفاده از هوش مصنوعی در عرصه خبر را بسنجند. بخش اول، حدود ۱۶ هزار ۸۰۰ یادداشت و سرمقاله در دوره زمانی اوایل سال ۲۰۲۰ تا نوامبر ۲۰۲۴ از ۲۵ رسانه در سه دسته بزرگ، محلی و دانشگاهی و بخش دوم، حدود ۲۱ هزار ۵۰۰ مطلب از روزنامههای محلی، تلویزیون، رادیو و پخش عمومی برای مقایسه بین قالبهای رسانهای بود.
چگونه متنهای ماشینی شناسایی شدند؟
محققان برای تشخیص متنهای ساخته شده بهوسیله هوش مصنوعی از سه سامانه «GPTZero» و «Binoculars» و «FastDetect-GPT» استفاده کردند. نخست این ابزارها را روی حدود ۱۷هزار مقاله واشنگتنپست از سال ۲۰۱۲ تا ۲۰۱۷ یعنی پیش از عصر جیپیتی اعتبارسنجی کردند تا نرخ مثبتِ کاذب (متنهایی که بهاشتباه تولیدشده توسط هوش مصنوعی تشخیص داده میشدند) را بسنجند و درنهایت تعیین کردند اگر دستکم دو ابزار یک مطلب را ساخته هوش مصنوعی تشخیص میداد، به آن برچسب ساخته هوش مصنوعی بزنند.
ظهور «ChatGPT»: نقطه عطف کاربرد هوش مصنوعی در حوزه خبرنگاری
نخستین جهش محسوس در میزان استفاده از هوش مصنوعی در خبرها درست در سهماهه پایانی سال ۲۰۲۲ رخ داد؛ زمانی که «ChatGPT-۳/۵» برای عموم عرضه شد. از این نقطه به بعد، یعنی در دوره پس از عرضه «GPT»، تقریباً در همه دستههای رسانهای سهم متنهایی که با استفاده از هوش مصنوعی تولید شده بودند افزایش چشمگیر یافت. بااینحال، شدت این رشد یکسان نبود .رسانههای محلی بیشترین تغییر را نشان دادند و سهم استفاده آنها نسبت به دوره پیش از «GPT» تقریباً ده برابر شد؛ این یعنی تحریریههای کوچکتر که معمولاً منابع محدودتری دارند، سریعتر و گستردهتر به سمت استفاده از ابزارهای زبانی رفتند.
پسازآن، نشریات و روزنامههای دانشگاهی قرار دارند که آنها نیز هرچند با شدتی کمتر از رسانههای محلی، رشد قابلتوجهی را تجربه کردند. در مقابل رسانههای بزرگ و جریان اصلی کمترین میزان افزایش را داشتند؛ مسئلهای که میتواند بازتابدهنده نظارت سختگیرانهتر، سیاستهای مشخصتر و حساسیت بالاتر این رسانهها نسبت به اعتبار و شفافیت باشد.
روند زمانی در تعداد مقالات نوشته شده باهوش مصنوعی (۲۰۲۰-۲۰۲۴) برای سه دسته از رسانههای خبری
علاوه بر این، ازنظر قالب رسانهای، روزنامهها بیشترین افزایش حجم محتوای تولیدشده توسط هوش مصنوعی را داشتند. رادیو هم پس از روزنامهها رشد قابلتوجهی داشت. در این میان، تلویزیون روند افزایش ملایمتری داشت و بخشی از موارد در این دو، به قالبهای ماشینی مثل پیشبینی هوا یا تبلیغ اشتراک برمیگشت که الزاماً نشاندهنده هوش مصنوعی مولد نیست اما نشاندهنده خودکارسازی متنی در جریان کار است.
در ادامه بررسیهای دقیقتر نشان داد که نویسندگان بیشتر در آغاز کار سراغ هوش مصنوعی میروند. یعنی مدلهای زبانی معمولاً برای شروع متن بهکار گرفته میشوند؛ جایی که پیدا کردن لحن و چارچوب اولیه سختتر است؛ اما وقتی به پایان متن میرسند، خبرنگاران ترجیح میدهند خودشان متنها جمعبندی کنند و نتیجهگیری را دستی بنویسند.
از نظر سبک نوشتن هم تفاوتهایی عمده میان متنهای انسانی و ماشینی دیده شد. متنهای ساختهشده با کمک هوش مصنوعی واژگان متنوعتری دارند و باعث خوانش روانتر میشوند، بهویژه در رسانههای کوچکتر که معمولاً محدودیت منابع دارند. در عوض، رسمیت زبان با استفاده از هوش مصنوعی کمی پایین میآید و استفاده از نامهای خاص مثل نام افراد، ملیتها یا گروهها نیز در متون مبتنی بر هوش مصنوعی کاهش مییابد. بهبیاندیگر، این متنها کمتر به جزئیات دقیق و مشخص تکیه دارند.
همچنین، در نوشتههای تولیدشده توسط هوش مصنوعی، استفاده از صفتها، قیدها و واژههایی مثل حروف اضافه و فعلهای کمکی بیشتر است. این ویژگی باعث میشود متنها پرجزئیاتتر و ازنظر ساختاری غنیتر بهنظر برسند، اما در عوض نوعی یکنواختی سبکی و نوشتاری در آنها شکل میگیرد.
در نهایت بسیاری از کارشناسان بر این باورند که مدلهای زبانی بزرگ کمک میکنند متن روانتر و آسانتر خوانده شود، اما در عوض بخشی از غنای انسانی و تنوع سبکهای نگارشی با اتکا به این ابزارهای فناورانه از بین میرود؛ موضوعی که در محتوای تولید شده از سوی رسانههای کوچکتر بیشتر به چشم میآید. همچنین نویسندگان در بخش پایانی مقاله خود هشدار میدهند که آینده روزنامهنگاری وابسته به سیاستهای روشن و مسئولانه در استفاده از هوش مصنوعی است. به گفته آنها، تحریریهها باید مشخص کنند چه زمانی از این ابزارها استفاده میشود و با شفافیت به مخاطبان اطلاع دهند. تنها در این صورت است که میتوان از مزایای زبانی و سرعت این فناوری بهره گرفت بیآنکه کیفیت، هویت رسانهها و اعتماد عمومی قربانی شود.
به گزارش زاویه؛ این روند در رسانههای کوچکتر (محلی و دانشگاهی) شدیدتر بوده و بیش از همه در بخشهای ابتدایی متنهای خبری دیده میشود. پژوهش همچنین نشان میدهد که محتوای خبری تولید شده توسط هوش مصنوعی معمولاً خواناتر و غنیتر است اما میزان تنوع و سبک انسانی را کمتر دارد.
پژوهشگران در طراحی تحقیق خود، دو منبع داده ساختند تا هم «زمان و مکان» و هم «چگونگی» استفاده از هوش مصنوعی در عرصه خبر را بسنجند. بخش اول، حدود ۱۶ هزار ۸۰۰ یادداشت و سرمقاله در دوره زمانی اوایل سال ۲۰۲۰ تا نوامبر ۲۰۲۴ از ۲۵ رسانه در سه دسته بزرگ، محلی و دانشگاهی و بخش دوم، حدود ۲۱ هزار ۵۰۰ مطلب از روزنامههای محلی، تلویزیون، رادیو و پخش عمومی برای مقایسه بین قالبهای رسانهای بود.
چگونه متنهای ماشینی شناسایی شدند؟
محققان برای تشخیص متنهای ساخته شده بهوسیله هوش مصنوعی از سه سامانه «GPTZero» و «Binoculars» و «FastDetect-GPT» استفاده کردند. نخست این ابزارها را روی حدود ۱۷هزار مقاله واشنگتنپست از سال ۲۰۱۲ تا ۲۰۱۷ یعنی پیش از عصر جیپیتی اعتبارسنجی کردند تا نرخ مثبتِ کاذب (متنهایی که بهاشتباه تولیدشده توسط هوش مصنوعی تشخیص داده میشدند) را بسنجند و درنهایت تعیین کردند اگر دستکم دو ابزار یک مطلب را ساخته هوش مصنوعی تشخیص میداد، به آن برچسب ساخته هوش مصنوعی بزنند.
ظهور «ChatGPT»: نقطه عطف کاربرد هوش مصنوعی در حوزه خبرنگاری
نخستین جهش محسوس در میزان استفاده از هوش مصنوعی در خبرها درست در سهماهه پایانی سال ۲۰۲۲ رخ داد؛ زمانی که «ChatGPT-۳/۵» برای عموم عرضه شد. از این نقطه به بعد، یعنی در دوره پس از عرضه «GPT»، تقریباً در همه دستههای رسانهای سهم متنهایی که با استفاده از هوش مصنوعی تولید شده بودند افزایش چشمگیر یافت. بااینحال، شدت این رشد یکسان نبود .رسانههای محلی بیشترین تغییر را نشان دادند و سهم استفاده آنها نسبت به دوره پیش از «GPT» تقریباً ده برابر شد؛ این یعنی تحریریههای کوچکتر که معمولاً منابع محدودتری دارند، سریعتر و گستردهتر به سمت استفاده از ابزارهای زبانی رفتند.
پسازآن، نشریات و روزنامههای دانشگاهی قرار دارند که آنها نیز هرچند با شدتی کمتر از رسانههای محلی، رشد قابلتوجهی را تجربه کردند. در مقابل رسانههای بزرگ و جریان اصلی کمترین میزان افزایش را داشتند؛ مسئلهای که میتواند بازتابدهنده نظارت سختگیرانهتر، سیاستهای مشخصتر و حساسیت بالاتر این رسانهها نسبت به اعتبار و شفافیت باشد.
روند زمانی در تعداد مقالات نوشته شده باهوش مصنوعی (۲۰۲۰-۲۰۲۴) برای سه دسته از رسانههای خبری
علاوه بر این، ازنظر قالب رسانهای، روزنامهها بیشترین افزایش حجم محتوای تولیدشده توسط هوش مصنوعی را داشتند. رادیو هم پس از روزنامهها رشد قابلتوجهی داشت. در این میان، تلویزیون روند افزایش ملایمتری داشت و بخشی از موارد در این دو، به قالبهای ماشینی مثل پیشبینی هوا یا تبلیغ اشتراک برمیگشت که الزاماً نشاندهنده هوش مصنوعی مولد نیست اما نشاندهنده خودکارسازی متنی در جریان کار است.
در ادامه بررسیهای دقیقتر نشان داد که نویسندگان بیشتر در آغاز کار سراغ هوش مصنوعی میروند. یعنی مدلهای زبانی معمولاً برای شروع متن بهکار گرفته میشوند؛ جایی که پیدا کردن لحن و چارچوب اولیه سختتر است؛ اما وقتی به پایان متن میرسند، خبرنگاران ترجیح میدهند خودشان متنها جمعبندی کنند و نتیجهگیری را دستی بنویسند.
از نظر سبک نوشتن هم تفاوتهایی عمده میان متنهای انسانی و ماشینی دیده شد. متنهای ساختهشده با کمک هوش مصنوعی واژگان متنوعتری دارند و باعث خوانش روانتر میشوند، بهویژه در رسانههای کوچکتر که معمولاً محدودیت منابع دارند. در عوض، رسمیت زبان با استفاده از هوش مصنوعی کمی پایین میآید و استفاده از نامهای خاص مثل نام افراد، ملیتها یا گروهها نیز در متون مبتنی بر هوش مصنوعی کاهش مییابد. بهبیاندیگر، این متنها کمتر به جزئیات دقیق و مشخص تکیه دارند.
همچنین، در نوشتههای تولیدشده توسط هوش مصنوعی، استفاده از صفتها، قیدها و واژههایی مثل حروف اضافه و فعلهای کمکی بیشتر است. این ویژگی باعث میشود متنها پرجزئیاتتر و ازنظر ساختاری غنیتر بهنظر برسند، اما در عوض نوعی یکنواختی سبکی و نوشتاری در آنها شکل میگیرد.
در نهایت بسیاری از کارشناسان بر این باورند که مدلهای زبانی بزرگ کمک میکنند متن روانتر و آسانتر خوانده شود، اما در عوض بخشی از غنای انسانی و تنوع سبکهای نگارشی با اتکا به این ابزارهای فناورانه از بین میرود؛ موضوعی که در محتوای تولید شده از سوی رسانههای کوچکتر بیشتر به چشم میآید. همچنین نویسندگان در بخش پایانی مقاله خود هشدار میدهند که آینده روزنامهنگاری وابسته به سیاستهای روشن و مسئولانه در استفاده از هوش مصنوعی است. به گفته آنها، تحریریهها باید مشخص کنند چه زمانی از این ابزارها استفاده میشود و با شفافیت به مخاطبان اطلاع دهند. تنها در این صورت است که میتوان از مزایای زبانی و سرعت این فناوری بهره گرفت بیآنکه کیفیت، هویت رسانهها و اعتماد عمومی قربانی شود.
