فضای وب، به عنوان تار عنکبوتی از صفحات درهمتنیده، حاوی اطلاعاتی گسترده و بسیار ارزشمند است که اهمیت آن در پیشرفت علموفناوری غیرقابلانکار است. هرکدام از وبگاهها و صفحات تودرتوی آنها را میتوان کتابی مملو از اطلاعات مهم و ارزشمند دانست که زمان و هزینهی قابل اعتنایی برای تولید آنها صرف شده است. پرسشی که مطرح میگردد اینست که آیا میتوان با استفاده از رباتهای نرمافزاری (برنامههای نرمافزاری که توان خزیدن خودکار در صفحات وب و استخراج دادهها را دارند) به استخراج دادهها از صفحات مختلف پرداخته و آنها را به شکل یکجا تجمیع نمود؟ آیا میتوان با استفاده از اسکریپتها (برنامههای کوچکی که کدنویسی شدهاند) به استخراج دادههای موجود در پایگاههای داده دیگران اقدام کرد؟
وب اسکریپینگ یا استخراج داده از وب چیست؟
وب اسکریپینگ را در بیانی ساده میتوان به بارگیری (دانلود) خودکار دادههای موجود در یک صفحهی وب و استخراج اطلاعات خاصی از آن دانست. اطلاعات استخراج شده ممکن است به راحتی در ساختارهای متنوعی (دیتابیس، فایل، سند ورد، و غیره) ذخیره شوند. به عنوان مثال، شما ممکن است با استفاده از یک ربات خزندهی استخراج کنندهی وب، اطلاعات نرخ ارز بیتکوین را به شکل روزانه از سایت خاصی دریافت کرده و آن را در یک پایگاه داده ذخیرهسازی کنید. یا ممکن است اسکریپتی بنویسید که با استفاده از آن، صفحات اختصاصی تکتک کاربران شبکهی اجتماعی فیسبوک را بارگیری کرده و در فایل خاصی ذخیرهسازی نمایید.
استخراج داده از وب اقدامی مفید است یا زیانبار؟
استفاده از رباتهای خرندهی وب، امری است که به وفور و به شکلی متداول در حال انجام است. پرسش در مورد مفید یا مضر بودن استفاده از فناوری مزبور، مثل پرسش در این خصوص است که آیا لینکدهی به سایتهای دیگر، کاری مفید است یا مضر. واضح است که این اقدامات به خودی خود نمیتوانند مفید یا مضر تلقی شوند، بلکه نوع استفادهی از آنهاست که امکان ورود ضرر و زیان به سایرین یا ایجاد منفعت برای عامه را ایجاد میکند.
میدانیم که موتورهای جستوجو (همچون گوگل، بینگ، الکسا و غیره) همواره و به شکلی پیوسته در حال استخراج دادهها از صفحات وب متعلق به دیگران، ذخیرهسازی محتویات مزبور در پایگاههای دادهی عظیم و تحلیل و بررسی آنها و ایجاد دانش از آنها هستند. آشکار است که هرگونه ممنوعیتی برای موتورهای جستوجو در استفاده از این اقدامات، صدمات جبرانناپذیری به فضای وب وارد خواهد آورد و دسترسی آسان و آزاد به اطلاعات را، به عنوان حقی از حقوق بشر امروزی، با مشکل مواجه خواهد ساخت.
از سویی دیگر، همواره سایتهایی چون لینکدین، فیسبوک و سایر شبکههای اجتماعی در معرض رباتهای استخراج کنندهی اطلاعات هستند که عدم مقاومت در مقابل آنها، میتواند به نقض حریم خصوصی و نیز از دست دادن مزایای رقابتی و تجارتی شرکتهای مزبور منجر شود. به علاوه، رباتهای مورد اشاره، ممکن است بواسطهی درخواستهای مکرر و غیر متعارفی که به سرورهای هدف میفرستند، روند خدمت رسانی آنها به افراد عادی را مختل نموده و یا حتی آنها را موقتاً از دسترس خارج نمایند. به این موارد باید اضافه نمود این مسئله را که ممکن است هدف منتشر کنندهی اطلاعات، دسترسی ساده و جزئی به آنها بوده و هرگز تمایلی به انتشار آن دادهها به طور منسجم و تجمیع شده نداشته باشد.
آیا استخراج داده از وب عملی قانونی تلقی میشود؟
استخراج داده از وب، به خودی خود نمیتواند عملی غیرقانونی تلقی شود، چرا که شما ممکن است از این دانش برای استخراج دادههای متعلق به خود یا افرادی که از آنها دارای مجوز هستید استفاده نمایید.
عمل استخراج داده را در مواردی که سایت هدف به وضوح و طی قرارداد «شرایط استفاده از خدمات»، ممنوع کرده است، میتوان موجب مسئولیت قراردادی دانست. بر این اساس، شرکت مزبور میتواند با استناد به مفاد آن قرارداد، استخراج کنندهی اطلاعات را طرف دعوا قرار داده و بابت نقض قرارداد، از او مطالبهی خسارت کند.
همچنین، اگر عمل وب اسکریپنگ باعث ورود ضرری به سایت هدف شده و با ایجاد وقفه در خدمت رسانی، تخریب دادهها، بروز خسارت به سرورها یا غیره، خسارتی را به صاحب آن وبگاهها وارد نماید، این عمل قابل پیگرد قانونی بوده و صاحب سایت میتواند با استناد به قواعد عام مسئولیت مدنی، علیه نامبرده طرح دعوا کرده و خسارت دریافت کند.
اما سوال دیگری که در اینجا پیش میآید اینست که اگر عمل استخراج داده نه بموجب قراردادی منع شده باشد و نه باعث بروز خسارت به صاحب سایت شود، آیا این عمل را میتوان ممنوع و غیرقانونی دانست؟ آیا ممکن است استخراج دادههای تحت حمایت کپیرایت، نقض کپیرایت شناخته شود؟
با بررسی قوانین ایالات متحده امریکا، اتحادیه اروپا و استرالیا بنظر میرسد عمل استخراج دادههای وب تحت شرایطی میتواند منجر به نقض حقوق انحصاری مالکیت فکری صاحب دادههای مزبور گردیده و بتوان تحت قواعد خاصی، دستور منع از تداوم اقدامات مورد اشاره و نیز حکم به پرداخت خسارت را دریافت کرد. در بررسی نقض حقوق مالکیت فکری، بنظر میرسد یکی از دفاعیات مهمی که شخص استخراج کنندهی اطلاعات میتواند به آن استناد کند و ممکن است دفاع متناسبی در مقابل ادعاهای شرکت صاحب وبگاه باشد، اصل استفادهی منصفانه از اطلاعات تحت کپیرایت و نیز اصل دسترسی آزاد به اطلاعات باشد.
اما بررسی قوانین مرتبط ایران از جمله قانون جرایم رایانهای مصوب ۱۳۸۹، قانون تجارت الکترونیک مصوب ۱۳۸۲، قانون حمایت از حقوق پدیدآورندگان نرمافزارهای رایانهای مصوب ۱۳۷۹ و نیز قانون حمایت از حقوق مولفان، مصنفان و هنرمندان مصوب ۱۳۴۸ این نتیجه را برای نویسنده آشکار کرد که اولاً، پایگاههای داده اصولاً بطور جدی و دقیق مورد حمایت قوانین ایران قرار نگرفتهاند. (اگرچه بنظر نویسنده میتوان با استنباط از قوانین مرتبط، حمایت از آنها را اثبات کرد). دوماً، عمل مزبور بههیچوجه به صراحت جزء اعمال مجرمانه تلقی نشده و در هیچ قانونی، صراحتاً جرم انگاری نشده است. سوماً، اگر استخراج دادههای مزبور به شکل کلی و به نحوی باشد که بتوان آن را تکثیر تمام پایگاه دادهی متعلق به دیگری دانست، صاحب وبگاه ممکن است بتواند علیه استخراج کنندهی اطلاعات دعوای نقض حق تکثیر متعلق به مولف را ادعا کند. البته نباید از نظر دور داشت که این عمل را نمیتوان تکثیر پایگاه داده دانست، بلکه حداکثر ممکن است عمل استخراج داده از وب را نقض حق تکثیر دادههای موجود در پایگاه دادهی متعلق به دیگری تلقی نمود، چرا که یک پایگاه داده، علاوه بر دادههای موجود در آن، احتمالا دارای اجزای دیگری چون ساختار، پرسشها، گزارشها، فرمها و غیره خواهد بود و نقض حق تکثیر پایگاه داده در شرایطی محقق میشود که تمام پایگاه داده، با اجزاء و عناصر مزبور، بدون مجوز تکثیر گردد.
مقالهی مرتبط: امضای الکترونیک؛ راهی مطمئن برای انعقاد قراردادها آنلاین