
Շուրջ 5 ամիս առաջ մեր բլոգի ընթերցողների ուշադրությանն էի արժանացրել հոդված HTML5-ի մասին, որտեղ հատուկ շեշտել էի, որ HTML 5-ի կոնցեպտուալ նորությունը կայքէջի սեգմենտացիան է։ Ս.թ. մարտի 22-ին, որպես HTML5-ի սկզբունքների որդեգրման քայլ, գուգլը ձեռք բերեց «փաստաթղթի տարբեր բաժինների թեմատիկ հատվածավորման» արտոնագիրը։
Մինչ այս պահը վերեւի հոդվածը դիտվել է 540 անգամ, ուստի այժմ կփորձեմ մի փոքր լրացնել ընթերցողների հետաքրքրությունը։ «Վեբ էջի սեգմենտացիայի» գաղափարի ճիշտ ընկալումը մեզ թույլ կտա հասկանալ, թե ի՞նչն է մոտ ապագայում գուգլի համար դառնալու կարեւոր՝ որպես վեբ կայքի էջի բովանդակությունը գնահատելու չափանիշ։
Վեբ էջի կառուցվածքային տարրերը եւ դրանց տարբերակված նշանակությունը
Սովորաբար, «ստանդարտ» վեբ էջը կազմված է մի շարք «սեգմենտներից»՝ էջի ամենավերեւի շրջանը ներկայացնող «հիդերը» (header), ամենաստորին մասը կամ «ֆութերը» (footer), վեբ կայքի նավիգացիոն մասը կամ «մենյուն» (menu, navigation bar), հիմնական բովանդակությունը կամ բուն հոդվածը (main content), գովազդային վահանակները (ads), այլ հարակից մասեր եւ այլն։
Սա նորություն չէ, հատկապես վեբ դիզայներների համար։ Նորություն չէ նաեւ այն, որ էջից-էջ հիմնականում փոփոխվում է միայն էջի հիմնական բովանդակությունը կամ բուն հոդվածը, իսկ կառուցվածքային մնացած տարրերը մնում են նույնը։
Այնուամենայնիվ, բոլորս էլ ընդունում ենք, որ վեբ էջի այս տարբեր մասերն ունեն տարբեր դեր ու նշանակություն։ Ինչպես այցելուների, այնպես էլ (այժմ եւ ավելի շատ՝ ապագայում) գուգլի համար վեբ կայքի ամենակարեւոր շրջանը էջի հիմնական բովանդակությունն է՝ բուն հոդվածը, առցանց պատկերասրահի դեպքում՝ պատկերը, վեդեո-պորտալի դեպքում՝ տեսահոլովակը եւ այն ամենը, ինչի համար ստեղծվել է տվյալ էջը։ Իսկ սա նշանակում է, որ այժմ, եւ ավելի շատ՝ ապագայում գուգլում որեւէ բառով որոնում կատարելիս որպես փնտրման արդյունք կցուցադրվեն միայն այն էջերը, որոնց հիմնական բովանդակությունը (եւ ոչ թե մյուս շրջանները՝ «հիդեր», «ֆութեր», գովազդային դաշտ եւ այլն) պարունակում է որոնելի բառը կամ արտահայտությունը։
«Բանալի բառերի լեզվով» եթե ասենք, ապա գուգլը ուշադրության է արժանացնելու վեբ էջի բուն հոդվածի մեջ տարալուծված եւ ոչ թե ամբողջ էջի տարբեր մասերում «շաղ տված» բանալի բառերը։
Այսպիսով, գուգլը եւս մեկ անգամ ապացուցում է, որ իր համար որեւէ վեբ կայքի եւ դրա առանձին էջերի գնահատման թիվ մեկ ցուցանիշը ճիշտ բանալի բառեր պարունակող բովանդակությունն է։
Գուգլի արտոնագրի կարեւոր կետերը
Ահա, այսպիսի նախնական տեղեկատվությունից հետո արժի հասկանալ, թե ինչ նոր սկզբունքներով է առաջնորդվելու գուգլը՝ գնահատելու այս կամ այն վեբ կայքի վարկանիշը։
Վերոնշյալ արտոնագրում խոսք է գնում մի շարք այսպես կոչված «մոդուլների» մասին, որոնք էլ ընկած են լինելու գուգլի նորացված ալգորիթմի հիմքում։ Այս մոդուլներից ամենակարեւորները թվարկված են այստեղ։
- Հղումների վերլուծություն (link analysis), որը նշանակում է, որ վեբ էջի տարբեր շրջաններում առկա հղումները ստանալու են տարբեր «կշիռ»։ Այլ կերպ ասած, բուն հոդվածի մեջ հանդիպող հղումները կգերադասվեն «ֆութերում», «հիդերում» կամ գովազդային դաշտերում առկա հղումներց։ Եվ սա խելամիտ է. բոլորս էլ տեսել ենք կայքէջեր, որոնց ստորին մասը ոչ այլ ինչ է, քան անկապ հղումների կույտ։
- Տեքստային վերլուծություն (text analysis), որը, դարձյալ, վեբ էջի տարբեր սեգմենտներում առկա տեքստերի, նախադասությունների, արտահայտությունների ու բառերի միջեւ տարբերակում անցկացնելն է։ Այնպես որ, այսուհետեւ կարիք կզգացվի կենտրոնանալ էջի բուն բովանդակության, այլ ոչ թե «հարակից շրջանների» վրա։
- Նկարի կամ պատկերի նկարագրություն (image captioning), ըստ որի, էջում առկա նկարի կամ պատկերի մոտ գտնվող տեքստը, արտահայտությունները կամ բառերը ավելի մեծ ուշադրության կարժանացվեն, քան ավելի հեռու ընկածները։ Այս մոդուլն, ըստ էության, «գործի կդրվի» նկարների եւ պատկերների վարկանիշավորման ընթացքում։
- Առանձին մասերի կառուցվածք (snippet construction), որի դեպքում գուգլը ըստ որոնվող բառի կգտնի էջի հիմնական բովանդակության մեջ առկա ամենամոտ եւ համապատասխանող մասը (մեկ կամ մի քանի նախադասություն, որոնք պարունակում են որոնելի բառը) եւ որոնման արդյունքներում կներկայացնի ամբողջ էջի հենց այդ հատվածը (եւ ոչ թե առաջին պարբերությունը)։ Ժամանակին ինքս բավականին մեծ ժամանակ եմ հատկացրել (եւ այժմ էլ իներցիայով շարունակում եմ) էջի մետա բանալի բառերի (meta keywords) եւ մետա նկարագրության վրա (meta description), ու որքան էլ ցավալի լինի, պետք է խոստովանել, որ գուգլի համար այս մետա նշագրերը կորցրել են իրենց նախկին նշանակությունը։ Այնուամենայնիվ, եկեք չմոռանանք, որ էջը պետք է գնահատել ոչ թե այցելուի համար անտեսանելի մետա նշագրերով, այլ տեսանելի հոդվածի տեքստով։
Աղբյուրը. e-armenians.com
Ողջույն, ես այս բլոգի հեղինակն եմ: Ուրախ կլինեմ, եթե դուք բաժանորդագրվեք բլոգի գրառումներին և ընթերցեք իմ էլ. գրքերը:
Մեր բլոգում Artur-ը գրել է 583 հոդված:
Եթե հավանեցիր այս հոդվածը, ապա միացիր մեր 306 ընթերցողներին և ստացիր անվճար էլ. ծանուցումներ







{ 2 մեկնաբանություն… դիտիր դրանք ներքևում կամ ավելացրու նորը }
Փաստորեն ասվածից կարելի է անել հետևալ եզրահանագումները
1. Որակյալ բովանդակություն – սպառողի ու Google-ի համար
2. Discriptions – փնտրման արդյունքներում սպառողին պատշաճ ներկայանալու համար
3. Tag clouds-ընթերցողին կողմնորոշելու համար
4. Keywords – ժամանակի ավելորդ ծախս
Հնարավոր է սա իրականությանը չի համապատասխանում, բայց ես այսպես ընկալեցի:
Օգտակար հոդված է, շնորհակալություն
Գուցե խրթին եմ մի քիչ գրել, սակայն մի քիչ խառնել ես
1. Որակյալ բովանդակություն սպառողի եւ գուգլի համար, որը պարունակում է համապատասխան բանալի բառեր
2. Այդ բովանդակության մեջ առկա հղումներ, նկարներ եւ այլ տարրեր:
2. Մետա-թեգերը, այդ թվում՝ նկարագրությունն այլեւս դարձել է քիչ օգտակար (շուտով՝ լրիվ անօգտակար)
3. Tag clouds-ի մասին խոսք չէր գնացել, սակայն դա վատ տարբերակ չէ՝ գուգլի որոնման արդյունքներում ըստ այդ բառերի հայտնվելու համար: Բայց կարծում եմ, որ ապագայում սա էլ կկորցնի իր գրավչությունը: