کلان‌داده‌ها؛ پایان نظریه و پارادایم جدید در علوم اجتماعی و فرهنگی

بدون شک، رشد سریع داده های دیجیتال و افزایش دسترسی به آنها، فصل جدیدی را برای علوم اجتماعی و فرهنگی باز کرده است. در تاریخ علوم فرهنگی و اجتماعی، هرگز با این مقدار از داده‌ها مواجه نبوده‌ایم. داده‌هایی که انواع پدیده‌های فرهنگی و اجتماعی و کنشگران آن‌ها را به خوبی نشان می دهد. یک بار به حجم عظیمی از اطلاعاتی که مردم در یک بازه زمانی کوتاه در اختیار شرکت‌های بزرگ آی.تی قرار می‌دهند فکر کنید. آن هنگام درک خواهید کرد که کلان‌داده‌ها چه منبع ارزشمندی برای تحلیل فرهنگی و اجتماعی هستند. آمارهای زنده‌ای که سایت «اینترنت لایو استیت»[۱] از اتفاقاتی که در ثانیه در شبکه جهانی اینترنت رخ می‌دهد را بنگرید. حداقل، هر دقیقه ۲ میلیون جستجو در گوگل انجام می شود، ۷۲ ساعت ویدیو در یوتیوب آپلود می گردد، ۵۲ هزار عکس به اینستاگرام اضافه می‌شود، ۱٫۸ میلیون کاربر فیس بوک با هم ارتباط می‌گیرند، ۲۰۴ میلیون ایمیل فرستاده می‌شود و ۲۷۸ هزار توییت در توئیتر ارسال می‌گردد. این حجم از اطلاعات ارسالی، کلان‌داده‌ها را هر روز غنی‌تر می‌کنند و دست پژوهشگران فرهنگی و اجتماعی برای ارائه انواع تحلیل‌ها بازتر می‌شود. هرچند هنوز هم تمامی انتقادات روش‌شناختی و معرفت‌شناختی به علوم اجتماعی داده‌محور وجود داشته باشد. اما ویژگی‌های کلان‌داده‌ها باعث می‌شود که این ادعا را مطرح کنیم که علوم فرهنگی و اجتماعی داده‌محور در پارادایم جدید مجددا ظهور کرده است. با این تفاوت که کلان‌داده‌ها، مسئله «فرضیه» را به کناری می‌نهد و این ادعا توسط کریس اندرسون (۲۰۰۸) مطرح می‌شود که آن‌قدر داده‌ها کافی است که نیاز به فرضیه‌ها و نظریه‌ها نیست و داده‌ها خود می‌توانند سخن گویند و در «پایان نظریه» به سر می‌بریم. به زعم وی، وجود «همبستگی» میان داده‌ها کافی است و الگوریتم‌های آماری می‌تواند الگوهایی را پیدا کند که روش‌های علمی پیش از این قادر به شناخت آن‌ها نبود. از این منظر، علم هم می‌تواند بدون مدل‌ها و نظریه‌های یکپارچه پیشرفت کند.

با این حال، چالش اساسی این است که آیا این داده‌ها عظیم به هم مرتبط، توسط ما قابل تحلیل است و یا توسط رایانه‌ها؟ و یا اساساً رایانه‌ها می‌توانند این داده‌ها را تحلیل کنند؟ کلان‌داده‌ها آنقدر پیچیده و مرتبط هستند که نمی‌توان آن‌ها را جدا از یکدیگر در نظر گرفت. این داده‌ها، به راحتی در اختیار ما قرار دارد، اما روش‌های تحلیل آن‌ها به سادگی رخ نمی‌دهد و اتفاقاً سویه مشکل داستان همین جاست. این داده‌ها چنان درهم آمیخته‌اند که جداسازی، استفاده و فهم آن‌ها می‌تواند پیامدهای مختلفی را در برداشته باشد. بنابراین ابتدا به ساکن هیچ داده‌ای نباید مورد فراموشی قرار گیرد. ضمن اینکه استفاده و تولید داده ها نمی تواند به طور جداگانه در نظر گرفته شود، زیرا از یک طرف، فرایند تولید بر امکان استفاده از داده ها تاثیر می گذارد و از سوی دیگر نیاز به استفاده از داده ها بر نحوه تولید آنها تاثیر می گذارد. در عین حال، تمرکز بر روی هر دو فرایند تولید و استفاده از داده ها، به ما امکان توجه دقیق‌تر را می‌دهد.

در مورد فرایند تولید می‌توان گفت که داده‌هایی که می تواند مورد استفاده برای علم اجتماعی و فرهنگی امروز قرار گیرد در نتیجه فرایندی طولانی و پیچیده در پایگاه‌های مختلف تولید شده‌اند. پژوهش‌گران علوم اجتماعی نیز روز به روز به استفاده از این داده‌ها علاقه بیشتری پیدا می‌کنند. بنابراین روش‌های آماری استفاده از این داده‌ها نیز رو به گسترش است تا پیچیدگی داده‌ها کمتر شود. از این جهت، فرایند «استفاده» و «تفسیر» داده‌ها، به دانش اجتماعی وابسته می‌شود و به تعبیری می‌توان گفت که داده در فرایند تفسیر از «پایگاه» خود منقطع می‌شود.

[۱] http://www.internetlivestats.com/

منبع: سلیمانی ساسانی، مجید (۱۳۹۷) «کلان‌داده‌ها؛ پایان نظریه و پارادایم جدید در علوم اجتماعی و فرهنگی»، صبح نو، دوشنبه ۱۹ شهریور ۱۳۹۷، شماره ۵۵۰، ص ۷٫