۷۵ درصد محتوای سایت های فارسی اسپم است!
دنیای وب

۷۵ درصد محتوای سایت های فارسی اسپم است!

نویسنده: تحریریه آن‌دیجیتال

با رشد اینترنت در کشور وبسایت های فارسی مختلفی راه اندازی شده که در آنها محتوای فارسی منتشر می شود. اما این محتواها تا چه اندازه مفید است؟ به نظر مدیر موتور جستجو ایرانی پارسی جو حدود ۷۵ درصد محتوای صفحات فارسی در وب بی ارزش یا به عبارتی اسپم هستند. با توجه به این حجم از محتوای بی ارزش لازم است توجهی جدی از جانب وب مسترها شود. 

مدیر جستجوگر پارسی جو در گفتگویی بیان داشته که این موتور جستجو میزان پوشش صفحات وب را دو برابر کرده و اکنون تعداد زیادی از صفحات ایرانی و فارسی در این موتور جستجو ثبت شده و در نتایج آن قرار گرفته اند. جویشگر پارسی جو به کمک نسخه جدید خود که با تغییرات جدی راه اندازی شده توانسته است ۴ میلیارد صفحه وب فارسی را تحت پوشش قرار دهد که این مقدار نسبت به سال گذشته دو برابر شده است.

ایشان ادامه داد که حدود ۷۵ درصد صفحات وب و محتوای سایت های ایرانی بی ارزش است و در میان ۴ میلیارد صفحه شناسایی شده توسط پارسی‌جو که همه فارسی بوده اند باید گفت که چیزی حدود یک میلیارد صفحه ارزشمند بوده و باقی آن که ۳ میلیارد صفحه می باشد تکراری یا اسپم بوده‌ است. این موضوع ناشی از عدم تولید محتوی مناسب در وب فارسی می باشد و به نظر می رسد حجم زیاد محتوا در وب فارسی به وسیله کپی کاری محتوای دیگران ایجاد شده است که عملا ارزشی ندارد.

با توجه به این که در دنیا روند تولید محتوی رو به رشد است و از نظر موتورهای جستجوی معروف جهان نظیر گوگل و بینگ نیز محتوای تولیدی ارزش بالایی دارد لازم است افراد فعال در فضای اینترنت و وب دانسته ها و تخصص شغلی خود را در وب سایت ها و وبلاگ خود منتشر کنند تا علاوه بر تولید محتوی معتبر و موثق گامی موثر در زمینه آگاهی رسانی تخصص خود انجام شود. لازم به ذکر است که این مهم باعث رونق گرفتن کسب و کار افراد نیز خواهد شد.

محتوای فارسی وب

پوشش ۴ میلیارد صفحه فارسی توسط پارسی جو

با توجه به این که حجم بالایی از صفحات وب بی ارزش است چالش بزرگی پیش روی موتورهای جستجو مخصوصا جستجوگرهای ایرانی نظیر پارسی جو و یوز قرار گرفته است زیرا پوشش این محتواهای بی ارزش باعث صرف و از بین رفتن زمان و فضای موتور جستجو و سامانه جستجوگر می شود. جستجوگر ملی پارسی جو برای کشف صفحات وب فارسی باید در میان انبوه صفحات جستجو انجام دهد تا از میان ۷۵ درصد صفحات بی ارزش ۲۵ درصد محتوای خوب و ارزشمند را پیدا کند و به کاربران نمایش دهد. این موضوع باعث اتلاف وقت و وارد آمدن فشار زیادی بر سرورهای سامانه می شود. علاوه بر این لازم است پارسی جو هوش مصنوعی خود را در بخش خزش و رتبه بندی نتایج بهبود بخشد تا در مقابله با این سایت ها عملکرد مناسبی داشته باشد.

برای دستیابی به نتایج قابل قبول وب عواملی نظیر هوش مصنوعی، درک صحیح از زبان فارسی و نوشتار آن، روشهای هوشمند حذف صفحات تکراری و اسپم و مدنظر داشتن نکات فرهنگی محتواها لازم و ضروری است که ما تا حد زیادی این موارد را رعایت می کنیم.

اگر چه در ایران استفاده از گوگل بسیار رایج است اما با این حال ما پارسی جو را راه اندازی کردیم و در حال حاضر بیش از ۱۵ سرویس متنوع و مختلف برای ارتقاء کیفیت نتایج جستجو به کاربران ارائه می دهیم و در این راه بیش از ۴ میلیارد سند فارسی را پوشش می دهیم. در این راه پارسی جو توانسته به میلیون ها پرس‌وجوی روزانه پاسخ دهد و امید است با حمایت های مردم این مقدار افزایش پیدا کند.

منبع: ایسنا

به این مطلب امتیاز دهید

مطالب مرتبط

مطالب پیشنهادی

نظرات کاربران (۰)