رتبه مغز گوگل چیست؟ چگونه کار می کند؟ آیا می توانید برای آن بهینه سازی کنید؟ در اینجا همه چیزهایی است که باید در مورد الگوریتم رتبه مغز گوگل بدانید.
اغراق نیست اگر بگوییم Google رتبه مغز گوگل انقلابی در نحوه تعیین نتایج جستجو بود.
در سال 1996، ایده پیوندها به عنوان یک سیگنال رتبه بندی، جستجو را با آنچه به رتبه صفحه گوگل تبدیل می شد، متحول کرد.
به همین دلیل است که دهه گذشته سهم بازار جستجو به این صورت است:
اتفاقات زیادی افتاده است و از آن زمان تغییرات و الگوریتمهای عظیمی معرفی شدهاند، اما بدون شک هیچ کدام به اندازه رتبه مغز گوگل مهم نیستند.
همانطور که در زیر بحث خواهیم کرد، این تنها به دلیل تأثیر آن بر نتایج نیست (اگرچه مسلماً در آنجا نیز برنده می شود) بلکه به معنای آن است - یادگیری ماشین برای اولین بار در آنچه ما به عنوان جستجو فکر می کنیم معرفی شد.
پیش از این از یادگیری ماشینی در Google News استفاده شده بود، اما چیزی شبیه به رتبه مغز گوگل نبود.
بنابراین، مهم بود. انقلابی بود. این معرفی یادگیری ماشین در جستجو بود.
ولی …
رتبه مغز گوگل سیستمی است که توسط آن گوگل بهتر میتواند هدف احتمالی کاربر از یک عبارت جستجو را درک کند. در بهار 2015 عرضه شد، اما تا 26 اکتبر همان سال اعلام نشد.
در ابتدا، رتبه مغز گوگل برای پرس و جوهایی اعمال شد که گوگل قبلاً با آنها مواجه نشده بود که در آن زمان و هنوز هم وجود دارد، حدود 15٪ از کل جستجوها. از آنجا گسترش یافت تا بر همه نتایج جستجو تأثیر بگذارد.
در هسته خود، رتبه مغز گوگل یک سیستم یادگیری ماشینی است که از مرغ مگس خوار ساخته شده است، که گوگل را از یک محیط "رشته ها" به "چیزها" رساند.
به این معنا که از «خواندن» کاراکترهای تحت اللفظی، و در عوض «دیدن» موجودیتی که آنها نمایندگی میکنند، گرفته شده است.
برای نشان دادن این پیشرفت مهم و نقش آن در رتبه مغز گوگل، به سادگی باید شخصیت هایی را که نام یکی از همتایان و دوستان من را تشکیل می دهند، در نظر بگیریم:
"جیسون بارنارد"
تا قبل از مرغ مگس خوار، گوگل آن کاراکترها و مجموعهای از 2 کلمه و 13 کاراکتر را میدید که به ترتیب مرتب شده و اغلب در یک صفحه استفاده میشد، آن را برای رشته جستجوی «جیسون بارنارد» مرتبط میکرد.
واقعاً این می تواند هر جیسون باشد، این مهم نبود.
آنها به پیوندها و چند سیگنال دیگر تکیه کردند تا "مرتبط" ترین آنها را آشکار کنند، بدون اینکه بفهمند جیسون کیست یا چیست.
با مرغ مگس خوار، دوست من دیگر مجموعه ساده ای از شخصیت ها نیست، بلکه به موجودیت تبدیل شده است:
/g/11cm_q3wqr
شناسه ماشین این مرد کدام است:
شناسه ماشین در این مورد یک دنباله الفبایی است که Google به یک نهاد اختصاص میدهد.
ما نمیتوانیم در این مقاله با جزئیات زیاد به نهادها بپردازیم، اگرچه میتوانید در اینجا درباره آنها بخوانید.
اما به طور خلاصه، آنچه در مورد مرغ مگس خوار برای عملکرد رتبه مغز گوگل ضروری بود، این بود که گوگل این عبارت را نبیند:
جیسون بارنارد دوست دیو دیویس است که پیراهن های قرمز را دوست دارد و یک بازاریاب دیجیتال است.
و به سادگی آن را به عنوان مجموعه ای از شخصیت ها تفسیر می کند که باید با پرس و جو مرتب شوند و سنجیده شوند.
در حالی که بسیار پیشرفته بودند، اساساً در پاسخ به این سوال گیر کردند: "جیسون بارنارد" چند بار در متن و در پیوندهای آن متن ظاهر می شود؟
با فرض اینکه پرس و جو دوباره «جیسون بارنارد» باشد، با مرغ مگس خوار، این جمله برای گوگل بیشتر شبیه به این خواهد بود:
هر موجودیت اصلی توسط یک Machine ID نشان داده می شود.
این شناسه ها برای هر یک منحصر به فرد هستند - و هیچ دو نهادی دارای شناسه یکسان نیستند.
من عمداً خودم را به جمله اضافه کردم تا نشان دهم که همیشه کامل نیست.
نام من بسیار رایج است، و «دیو دیوی» برجستهتر از من وجود دارد (میدانم، میدانم... باورش سخت است).
به دلیل پیشینه جیسون در موسیقی، گوگل به راحتی میتواند بدون زمینه اضافی فرض کند که دیو دیویزی که جیسون با آن دوست بود، دیو دیویس (/m/01pwfk) از The Kinks (/m/08w4pm) است.
گوگل از طریق سایر نهادهای موجود در صفحه و سایر اتصالات در وب توضیحاتی را دریافت می کند. اما این داستان دیگری است، برای یک روز دیگر.
آنچه در زمینه رتبه مغز گوگل مهم است این است که با مرغ مگس خوار، گوگل (/m/045c7b) اکنون دنیا را به عنوان مجموعه ای از چیزها درک می کند نه رشته ها.
با کمی اطلاعات موجود در مورد موجودیتها، میتوانیم به رتبه مغز گوگل برگردیم.
رتبه مغز گوگل در هسته خود را می توان به عنوان یک سیستم پیش غربالگری در نظر گرفت.
هنگامی که یک پرس و جو در Google وارد می شود، الگوریتم جستجو در تلاش برای نمایش بهترین محتوا، در بهترین قالب(ها) پرس و جو را با هدف شما مطابقت می دهد.
اما اگر گوگل قصد شما را نداند چه؟
رتبه مغز گوگل در ابتدا برای رفع یک مشکل ساده اما بزرگ راه اندازی شد.
گوگل 15% از پرس و جوها را مورد استفاده قرار نداده بود، و به همین دلیل هیچ زمینه ای برای آنها وجود نداشت، و نه تجزیه و تحلیل گذشته برای تعیین اینکه آیا نتایج آنها در برآورده کردن هدف کاربر خوب است یا خیر.
رتبه مغز گوگل را وارد کنید.
این سیستم به جای رشته ها به چیزها نگاه می کند.
رتبه مغز گوگل همچنین زمینههای محیطی (مثلاً مکان جستجوگر) را در نظر میگیرد و معنای جایی که انجام شده است را برونیابی میکند.
این می تواند یک فرآیند ساده برای درک این موضوع باشد که ترتیب کلمات ممکن است تابعی از فرآیند جستجو باشد و نه هدف.
چه کسی در میان ما یک پرس و جو را صرفاً با زدن یک یا دو کلمه اصلاح نکرده است.
قبل از اینکه وارد آن شوم، گوگل مطمئناً دیده است:
“پیتزا ویکتوریا قبل از میلاد مسیح”
اما وقتی مجموعهای را که میخواستم برنمیگردانم، ممکن است شروع به اضافه کردن شرایط کنم و در نتیجه سؤالی بیشتر شبیه به:
“پیتزا ویکتوریا بی سی سبزیجات با پوسته نازک”
احتمال زیادی وجود دارد که گوگل آن کوئری خاص را ندیده باشد، اما از آنجایی که آنها به چیزها نگاه می کنند نه رشته ها، می دانند که پرس و جو مشابه خواهد بود، اگر یکسان نباشد، مانند:
پیتزای گیاهی با پوسته نازک ویکتوریا قبل از میلاد مسیح
پیتزای گیاهی با پوسته نازک در نزدیکی من
یا با صدا:
"OK Google، از کجا می توانم یک پیتزای گیاهی با پوسته نازک تهیه کنم؟"
جای تعجب نیست که گوگل هرگز نحوه عملکرد رتبه مغز گوگل را مشخص نکرده است.
با این وجود، میتوانیم حدسهای درستی درباره آنچه در پشت صحنه میگذرد، بزنیم.
همانطور که در بالا توضیح داده شد، ما باید از فکر کردن با عباراتی که میفهمیم دست برداریم و مانند یک ماشین فکر کنیم.
جایی که ممکن است ببینم:
“پیتزا ویکتوریا قبل از میلاد مسیح”
گوگل می بیند:
/m/0663v /m/07ypt
این به طرز چشمگیری همه چیز را تغییر می دهد. "ویکتوریا بی سی" دو چیز نیست، بلکه یک چیز است.
هنگام مقایسه مکان های دیگر برای:
“پیتزا” “موقعیت”
آنها می توانند چنین استنباط کنند:
/m/0663v /m/07ypt (پیتزا ویکتوریا قبل از میلاد)
احتمالاً همان است:
/m/07ypt /m/0663v (پیتزا ویکتوریا قبل از میلاد)
اساساً، از آنجایی که آنها ماهیت نحوه عملکرد موجودیت ها را می دانند، می توانند فراتر از پرس و جو و به معنی نگاه کنند.
همانطور که در بالا ذکر شد، یکی از مکانیسم های اصلی که آنها استفاده خواهند کرد، شناسایی موجودیت است.
اگر آنها بفهمند که یک جستار حاوی همان مواردی است که قبلاً دیدهاند، با کمی صلاحیت (مانند تغییر از «کجا» به «وقتی» در یک پرس و جو در مورد کنسرت)، آنگاه این نشانهای خواهد بود که مجموعههای نتایج ممکن است یکسان، بسیار مشابه، یا حداقل از فهرست کوتاه یکسان URLها استخراج شده باشند.
گوگل در پتنت سال 2013 خود، پاسخ به پرسش با استفاده از ارجاعات موجودیت در داده های ساختار نیافته، روشی را شرح می دهد که در آن:
به عنوان مثال، اگر گوگل شناسه جیسون و شناسه من را اغلب همزمان ببیند، میتوانند این دو را به هم وصل کنند.
اگر جیسون و آن پسر مزاحم کینک بودند که مرتباً به خاطر نام من رتبه بندی می کردند ... آن وقت به این نتیجه می رسیدند که دیو دیویس است.
به طور مشابه، اگر ببینند که صفحاتی که برای نام جیسون رتبهبندی میشوند، مجموعهای از موجودیتهای مشترک روی خود دارند، میتوانند فرض کنند که دادههای کامل روی Jason شامل آن اطلاعات است و آنهایی را که فاقد آن هستند برای آن جستجو حذف کنند.
به یاد داشته باشید که این یک سیستم یادگیری ماشینی است.
ذاتی آن تابع تعیین، آزمایش، ردیابی و تنظیم است.
اساساً، سیستم با در نظر گرفتن معیار(های) موفقیت به جستجوها میپردازد.
سپس نحوه وزن کردن سیگنالهای مختلف را تنظیم میکند و به کدامیک علاقه دارد و سپس برای موفقیت نظارت میکند.
این کار بر اساس پرس و جو به پرس و جو انجام نخواهد شد.
به یاد داشته باشید، این سیستم برای رسیدگی به مشکل پرسشهایی که گوگل قبلاً با آنها مواجه نشده بود راهاندازی شد، اغلب کلماتی با حجم کم یا بدون حجم وجود دارند که نمیتوانند خودشان نظارت داشته باشند.
بلکه سیستم به دنبال الگوهایی مانند:
[مواد غذایی] [موقعیت مکانی] [واجد شرایط]
و سپس مجموعه قوانینی را ایجاد کنید که بر همه این پرسوجوها حاکم باشد.
بنابراین، اگر متوجه شد که وزن دهی سیگنال ها برای پرس و جوی مانند:
پیتزا ویکتوریا بی سی گیاهخوار
می تواند از آن برای پشتیبانی یا تقویت کاری که با پرس و جوی انجام می دهد استفاده کند:
تاکو سیاتل وا مرغ
همچنین، شایان ذکر است، سیستم فقط موجودیت های موجود در پرس و جو را در نظر نمی گیرد، بلکه نهادهایی را که در ساخت آن نقش دارند، در نظر می گیرد. این شامل شما، مکان شما، دستگاه شما و غیره می شود.
همه اینها متغیرهایی هستند که رتبه مغز گوگل تقریباً به همان روشی که احتمالاً به تجزیه و تحلیل خود نگاه می کنید و دسکتاپ خود را با ترافیک تلفن همراه خود مقایسه می کنید یا ساعت های روز یا انواع دستگاه ها را مرور می کند تا بفهمید که چگونه کاربران مختلف با تجارت شما در موارد مختلف تعامل دارند در نظر می گیرد.
مردم در گوگل باهوش هستند.
من به معنای واقعی کلمه هیچ شکی ندارم که اگر یکی از مهندسان مسئول نگهداری از رتبه مغز گوگل این مقاله را بخواند، به سادگی لبخند میزند و فکر میکند: «اوه... این زیبا نیست؟ یک سئوکار کوچک که فکر میکند میداند پشت پرده چه میگذرد…
آنها بدون شک دهها مکانیسم بیشتر از آنچه من فکر میکردم وارد رتبه مغز گوگل میکنند، و ماشینها ممکن است حتی بیشتر از خودشان ساخته باشند.
آنچه می خواهیم در ذهن داشته باشیم هدف است.
هدف درک پرس و جوها است.
متغیرهایی که باید با آنها مبارزه کنیم موجودیت ها و سیگنال ها و آنچه ماشین ها با آنها انجام می دهند هستند.
بنابراین، رتبه مغز گوگل برای مقابله با پرس و جوهایی که گوگل قبلا هرگز ندیده بود، توسعه داده شد.
اما بین بهار 2015 و 2016 این وضعیت تغییر کرد.
به نظر میرسد که مردم گوگل یک بار دیگر به ما توجهی نکردند، زیرا در مقالهای با Wired در زمان حال منتشر شد.
رتبه مغز گوگل در هر پرس و جو دخیل است.
یک بار دیگر، به نظر می رسد، گوگل بدون اینکه به کسی بگوید آن را منتشر کرد.
در آن زمان، و احتمالاً اکنون بیشتر، بسیار مؤثر در نظر گرفته می شد و به عنوان سومین سیگنال رتبه بندی مهم شناخته می شد.
این احتمالاً راه اشتباهی برای فکر کردن ما به رتبه مغز گوگل است، اما بیایید نگران معناشناسی نباشیم.
در عوض، با دانستن اهمیت آن (و بله، هنوز هم است، اگر با سیستمهای دیگر ترکیب شود، بسیار مهم است) اجازه دهید بر روی …
و بعداً، اساساً گفت که فقط برای کاربران بهینه سازی می شود:
شما محتوای خود را برای کاربران و در نتیجه برای رتبه بندی بهینه می کنید.
— گری 鯨理/경리 Illyes (@methode) 26 سپتامبر 2019
اما برای من، این یک بیانیه گوگلی است.
توصیه من برای کسانی که می خواهند برای رتبه مغز گوگل یا به عبارت بهتر، سایت خود را بهینه کنند و رتبه مغز گوگل و سیستم های مشابه را در نظر بگیرند؟
دنبال ترفند نباش
به دنبال تابع باشید
ابزار رایگانی که استفاده از آن در این کار جالب است، نسخه نمایشی API زبان طبیعی خود گوگل است.
فرض کنید میخواهیم بفهمیم Google چگونه مقالهای را که در بالا به آن پیوند دادم در مورد نهادها میبیند.
چه راهی بهتر از رفتن به منبع - گوگل.
ما می توانیم متن مقاله را کپی کنیم، آن را در نسخه ی نمایشی NLP خود جایگذاری کنیم، و voila!
تجزیه و تحلیل آنها در مورد اینکه کدام موجودیت ها در صفحه ظاهر می شوند به همراه تجزیه و تحلیل احساسات و نحو ارائه می شود.
متوجه خواهید شد که فلش های نحوی هم به جلو و هم به عقب حرکت می کنند.
شما می توانید از BERT برای مرتبط بودن تشکر کنید، نه از رتبه مغز گوگل.
اگر در لیست Entities به پایین اسکرول کنید، Google همچنین به شما یک تفکیک کامل از انواع موجودیت های موجود در صفحه را ارائه می دهد.
باید توجه داشته باشم که اینها کاملاً کامل نیستند و قرار است به عنوان یک موجودیت پیشفرض برای آموزش کار کنند - نه فهرست کاملی از نحوه مشاهده Google از جهان.
اما درک خوب و بصری از محتوای شما به شما می دهد.
ابزار رایگان دیگری که برای این کار دوست دارم Google Knowledge Graph API است، اما خروجی آن خیلی زیبا نیست.
خوشبختانه، همان دوستی که در مثال بالا از او استفاده کردم، در اکسپلورر گراف دانش رایگان خود است.
با Knowledge Graph Explorer، میتوانید بهصورت دستی بررسی کنید و ببینید Google در مورد یک موجودیت در زمان واقعی چه میبیند.
این رابطه بین سایر نهادهای موجود در صفحه را در نظر نمیگیرد، و گوگل واقعاً اعتماد به نفس آنها را تقویت میکند، اما کاملاً روشنگر است.
با استفاده از این دو ابزار، میتوانید بررسی کنید که گوگل چگونه سایتهای رتبهبندی برتر را برای جستارهای مختلف، چه موجودیتهایی در صفحات، افراد، مکانها یا چیزها و غیره درک میکند و درک واقعی از نحوه تفسیر صفحه توسط گوگل به دست آورید. چشم انداز مرغ مگس خوار.
از آنجا به آنها فقط برای در نظر گرفتن متغیرهایی نیاز داریم که نمی توانیم کنترل کنیم یا ببینیم، مانند مکان احتمالی کاربر، دستگاه و غیره.
گوگل به شما خواهد گفت که بهینه سازی برای رتبه مغز گوگل بهینه سازی برای کاربران است.
بسیار آسان است که ببینید این پیشنهاد آنها چگونه است، و این پیشنهاد بدی نیست.
اما می دانیم که بر روی موجودیت ها ساخته شده است.
پس چرا آن دانش را به تلاش های خود اضافه نمی کنید؟
درک کنید که گوگل چگونه قصد کاربر را تفسیر می کند، و خودتان متوجه خواهید شد که چگونه این کار را انجام دهید.
رتبه مغز گوگل نه تنها برای آنچه که هست، بلکه برای معنای آن مهم است.
این اولین فشار به یادگیری ماشینی بود که در نتایج جستجو در گوگل اعمال شد. آخرین نبود.
در واقع، در سال 2018، جان مولر خاطرنشان کرد:
من فکر میکنم قطار ایستگاه را ترک کرده است - ما در مکانهای زیادی از یادگیری ماشینی استفاده میکنیم، منطقی نیست که رتبه مغز گوگل را جدا کنیم و عوامل فردی را حدس بزنیم. رتبه بندی پیچیده است. متاسفم که پاسخ ساده ای نداشتم، اما سوال IMO بی ربط است :).
—