Menu

Duplicitný obsah je problémom, s ktorým sa stretáva množstvo webov. Vidíme ich často najmä v segmente e-shopov. Rovnaký obsah je v týchto prípadoch dostupný cez viac URL adries. Z pohľadu vyhľadávača Google ide o problém, ktorý môže viesť k poklesu pozícií. Dnes vám predstavím možnosti, ako ho riešiť použitím tzv. canonical (kánonických) adries.

Čo sú to kánonické URL adresy?

Slovo kánon je podľa Wikipedie aj „pevne stanovené pravidlo, predpis, norma“. V prípade webu hovoríme o tzv. canonical URL adresách, t. j. URL adresách, ktoré sú pre stránky pevne stanovené. Indexovací robot vyhľadávača teda pri objavení rovnakej stránky cez viacero tvarov URL tieto zahodí a zaznamená iba jednu, kánonickú URL adresu, ktorú zaradí do výsledkov vyhľadávania.

Definovaním canonical URL teda dosiahneme odstránenie duplicít, ktoré by inak mohli vznikať chybou systému na správu obsahu (CMS) webu alebo chybným zalinkovaním stránky a pod.

Ako vzniká duplicitný obsah?

Uvediem modelový príklad: E-shop má stránku s kategóriou chladničiek, kde ponúka ich filtrovanie podľa parametrov ako napr. typ otvárania dverí, umiestnenie a typ kombinovanej mrazničky, zásuvku zero fresh a pod. Navyše si ďalej produkty môžete triediť podľa názvu výrobcu (A – Z, ale aj Z – A), ceny (od najnižšej, od najvyššej) alebo hodnotenia (podľa počtu hviezdičiek).

Každú interakciu návštevníka s filtrom či radením si web musí (aspoň dočasne) nejako poznamenať, aby vedel zobraziť chladničky požadovaných parametrov. Často je riešením práve zmena URL, ktorá zväčša získa nejaký parameter navyše. Čím viac do detailov si návštevník filter a radenie nastaví, tým komplikovanejšie bude URL vyzerať.

Základná URL obsahujúca všetky chladničky bude:

https://example.com/chladnicky/

Zapneme filter kombinácie s mrazničkou:

https://example.com/chladnicky/?f[]=478

Pridáme podmienku zásuvky zero fresh:

https://example.com/chladnicky/?f[]=478&f[]=125

Zoradíme chladničky podľa ceny od najlacnejších:

https://example.com/chladnicky/?f[]=478&f[]=125&sort=price&dir=asc

Takouto jednoduchou interakciou s webom sme „vytvorili“ štyri rôzne URL adresy, na ktorých sa nachádza v rôznych obmenách stále ten istý obsah (zoznam ponúkaných chladničiek). Z pohľadu vyhľadávača ide o duplicitný obsah, ktorý je ale na samostatných URL adresách.

Keďže vyhľadávač berie každú zmenu URL adresy ako úplne novú URL, očakáva aj nový obsah. Ak mu ponúkneme veľa duplicitného obsahu na veľa rôznych adresách, vyhľadávač môže časť vyradiť, ale najmä nemusí zobrazovať vhodnú URL (teda stránku kategórie bez filtrov) vo výsledkoch vyhľadávania.

Iné príklady duplicitného obsahu sú domény, ku ktorým sa dá pristupovať cez www. aj bez www. (a nepresmerujú vás na preferovanú verziu) alebo rovnaký produkt nachádzajúci sa vo viacerých kategóriách (a teda aj na viacerých URL adresách).

Riešením je teda uvedenie kánonickej (canonical) URL adresy, ktorá vyhľadávaču jednoznačne uvedie preferovanú adresu.

Zároveň nastavenie canonical adresy pomôže aj spojeniu váhy spätných odkazov, z ktorých môžu viesť viaceré na rôzne verzie URL ale rovnaký obsah. Po nastavení canonical URL budú tieto spätné odkazy smerovať na jednu preferovanú adresu. Odporúčam overiť si v Google, či je vami preferovaná adresa naozaj tá, ktorú vníma ako najsilnejšiu aj Google.

Ako pridať kánonickú URL?

Je to veľmi jednoduché – do kódu stránok pridáte jeden riadok do hlavičky, prvok link rel=“canonical“ smerujúci na jedinú adresu, ktorú chcete mať vo výsledkoch:

<link rel="canonical" href="https://example.com/preferovana-adresa" />

Do CMS WordPress viete pridať kánonické URL rozšírením, napr. cez plugin Yoast SEO.

Naozaj sú to duplicity?

Môžete sa pýtať, či uvedený príklad vždy spĺňa definíciu duplicitného obsahu. Nemusí to tak byť. Na webe môžete mať produkty rozdelené do ďalších podkategórií ako napr.:

Sú v tomto prípade podradené kategórie duplicity voči hlavnej kategórii chladničiek? Zavisí to od viacerých faktorov. Ak je napríklad hlavná kategória chladničiek iba rázcestníkom do podradených kategórií, nepôjde o duplicitný obsah. Rovnako sa duplicitám môžete vyhnúť vhodným zadefinovaním titulkov a hlavného nadpisu stránky (TITLE a H1), ako aj popisu kategórie (META popisok a textový popis).

Ak by ste ale mali v hlavnej kategórii výpis všetkých produktov a v podkategóriách časť produktov podľa vybraných parametrov, ale bez ďalšieho obsahu, môže byť stránka z hľadiska vyhľadávača nezaujímavá, aj keď nemusí ísť priamo o duplicitu. Takéto stránky však bude problém do výsledkov vyhľadávania dostať, keďže nebudú mať okrem názvu žiaden originálny obsah, ktorý by ste už nemali zobrazený inde.

A čo stránkovanie?

Ak máte na webe obsah, ktorý je rozdelený na viacero stránok (napr. články v archíve, produkty v kategórii a pod.), odporúčame tiež pridať na web prvky stránkovania rel=prev a rel=next.

Opäť príklad: kategória obsahuje 95 produktov, ale štandardne zobrazujete iba 20. Znamená to, že produkty sú rozdelné do 5 stránok. Pre vyhľadávač označíte takýto obsah podľa postupu nižšie.
Na prvej stránke uvediete odkaz na stránku číslo 2:

<link rel="next" href="https://example.com/chladnicky/2/" />

Na druhej stránke uvediete odkazy na prvú a tretiu stránku:

<link rel="prev" href="https://example.com/chladnicky/1/" />
<link rel="next" href="https://example.com/chladnicky/3/" />

Podobne postupujete pre všetky ostatné stránky.

Kompletný kód  aj s kánonickou URL bude pre stránku číslo 2 takýto:

<link rel="canonical" href="https://example.com/chladnicky/2/" />
<link rel="prev" href="https://example.com/chladnicky/1/" />
<link rel="next" href="https://example.com/chladnicky/3/" />

Ak by ste na webe mali všetky produkty zobrazené na prvej stránke a ostatné stránky by boli len doplnkové (napr. pri zmene počtu vylistovaných produktov), tak je vhodné použiť kánonickú URL hlavnej stránky kategórie. Opäť: na ostatných stránkach už zobrazujete obsah, ktorý je k dispozícii ako originálny na hlavnej stránke kategórie. Stále však odporúčame použiť stránkovacie odkazy na predchádzajúcu stránku (rel=prev) a nasledujúcu stránku (rel=next).

Ukážkový kompletný kód bude pre stránku číslo 2 takýto:

<link rel="canonical" href="https://example.com/chladnicky/" />
<link rel="prev" href="https://example.com/chladnicky/1/" />
<link rel="next" href="https://example.com/chladnicky/3/" />

Kánonické odkazy riešia problém duplicitného obsahu, ktorý už vznikol. Z pohľadu udržateľnosti webu je však dôležité duplicitám predchádzať, a teda na ne myslieť už pri navrhovaní štruktúry URL (vyhľadávania, filtrov, kategórií atď.). V prípade správne navrhnutej informačnej architektúry vám teda duplicitný obsah vznikať nebude.

Páčil sa Vám článok?

Nenechajte si újsť raz mesačne naše najdôležitejšie novinky!
  • Toto pole je pre validačné účely a mal by zostať nezmenený.
  • Tomáš Schabjuk

    týka sa problém duplicitných textov aj na blogu?

    • Ak tam existujú rôzne výpisy článkov s filtrami, tak áno.

  • Mário Babej

    Je duplicitou ak sa vo filtrovaných produktoch v kategórii mení URL, no zároveň sa generuje aj unikátny title a H1?

    • Dobrá otázka. Myslite na to, že pre Google je obsah všetko na danej stránke vrátane textov a obrázkov. Čiže iba zmenou titulku a H1 nedôjde k významnej zmene obsahu.

      Otázka asi smeruje skôr k inej štruktúre webu, ktorá nie je závislá iba na zmene filtrov vyhľadávania. Teda sa dá uvažovať o zmene štruktúry obsahu tak, aby existovali pevné kategórie a pod.