Wordfence ja Google Search Console

Wordfence-URL:t Google Search Consolessa

Jukka Peltoperä
Jukka Peltoperä
Julkaistu:  12.10.2022. Päivitetty:  17.10.2022.

Wordfence on näppärä tietoturvalisäosa WordPressille, jolla saat lisättyä WP-sivustollesi applikaatiotason palomuurin muun muassa brute force -hyökkäyksien torjumiseksi sekä sivuston skannaamiseen tunnettujen tietoturva-aukkojen, haittaohjelmien, takaovien, roskapostin ja injektioiden varalta.

Olen käyttänyt Wordfenceä myös WordPress-sivustojen reaaliaikaisen liikenteen seurantaan sen Live Traffic -työkalulla, jolla on näppärä estää liikenne kokonaan tietyistä IP-blokeista ja tunnistettavista isäntänimistä sekä ja user-agenteista.

Wordfencellä voi luoda blokkaussääntöjä sivustolle.

Mitä Wordfencen parametrit wordfence_lh ja hid ovat?

Jos käytät Wordfencen Live Traffic -työkalua ja Google Search Consolea, olet saattanut huomata, että Wordfence luo omia URL-osoitteita, jotka myös Googlen indeksointirobotit löytävät.

Ne tunnistaa URL-osoitteessa olevista wordfence_lh-, hid- ja aiemmin myös wordfence_logHuman-parametreista, esimerkiksi:

https://osoite.fi/?wordfence_lh&hid=...

Mitä nämä parametrit ovat:

  • wordfence_lh  sisältää tiedon, onko kävijä tunnistettu ihmiseksi.
  • hid on salattu yksilöllinen tunniste, jonka avulla tietue voidaan yhdistää toiseen tietokannassa olevaan tietueeseen.

Lisäosan tuen mukaan nämä URL-osoitteet ovat täysin normaaleja ja syy niiden ilmaantumiseen on käytetyssä WordPress-teemassa tai uudelleenohjauksissa. Tuen mukaan niiden pitäisi ajan myötä kadota Search Consolesta, koska ne palauttavat tyhjän sivun.

Näin ei kuitenkaan aina ole, vaan nämä osoitteet voivat jäädä "elämään" Search Consolessa määrittelemättömäksi ajaksi, vaikka teemaa vaihdettaisiin tai Wordfence poistettaisiin kokonaan.

Wordfencen luomia URL-osoitteita Google Search Consolessa

Wordfencen luomia URL-osoitteita Google Search Consolessa

Mitä haittaa Wordfence-URL:eista on Search Consolessa?

Yleensä Wordfence-lisäosan luomista osoitteista ei ole mitään haittaa.

Vaikka teknisesti hyvin optimoiduilla sivustoilla kyseisiä parametreja sisältävät URL:t on kanonisoitu, Google-robotit käyvät jatkuvasti osoitteita läpi selvittääkseen onko osoitteiden takana oleva sisältö muuttunut.

Lisäksi ylimääräiset osoitteet kuormittavat verkkosivuston crawl-budjettia, eli sitä sivumäärää, jonka Googlebot käy läpi ja indeksoi sivustolta määrättynä ajanjaksona.

Erityisesti ne luovat Search Consoleen seuraavia "ongelmia":

  • Vaihtoehtoinen sivu, jolla on oikea ensisijainen tagi
  • Indeksoitu, ei tällä hetkellä hakemistossa

Ongelmat voivat jäädä Search Consoleen vuosiksi ja triggeröidä sähköposti-ilmoituksia uusista ongelmista sivustolla.

Jos kyseiset osoitteet eivät palauta tyhjää sivua, tai ilmoitukset niistä muuten ärsyttävät, seuraavassa kappaleessa on tarjolla ratkaisuja.

Wordfence-URL:ien poistaminen Search Consolesta

Tässä kolme tapaa lähestyä "ongelmaa".

Wordfence Live Traffic asetukset

1. Live Traffic -ominaisuuden poistaminen käytöstä

Selaa Wordfence > All Options > (vieritä alas asti kohtaan) Tool Options.

Valitse Security Only ja pienennä lukua kohdassa "Amount of Live Traffic data to store" (kuvassa 100).

Voit estää Live Trafficin kokonaan myös wp-config.php-tiedostosta:

define('WORDFENCE_DISABLE_LIVE_TRAFFIC', true);

2. Osoitteiden selaamisen kieltäminen robots.txt-tiedostossa

Voit kieltää Wordfence-parametreja sisältävien URL:ien selaamisen verkkosivuston juuressa olevassa robots.txt-tiedostossa.

Älä käytä tätä menetelmää, jos haluat poistaa Search Consolessa jo näkyvät Wordfence-URL:t, vaan siirry kohtaan 3.

User-agent: *
Disallow: */?wordfence_lh*

Kannattaa huomata, että robots.txt-säännöt ovat vain ohjeistuksia, eikä Google tai muut hakurobotit välttämättä noudata niitä.

3. Osoitteiden ohjaaminen varsinaiseen osoitteeseen

Jos olet poistanut Wordfence-lisäosan, etkä halua enää käyttää sitä, 301-uudelleenohjaa lisäosan parametreja sisältävät URL:t varsinaiseen osoitteeseen .htaccess-tiedon avulla näin:

# Remove the entire query string if any one of the URL params are present
RewriteCond %{QUERY_STRING} (&|^)(wordfence_lh|hid|wordfence_logHuman)=
RewriteRule ^ %{REQUEST_URI} [QSD,R=301,L]

Ohjauksen tarjosi MrWhite Stackoverflowssa.

Huom! Jos käytät menetelmää 3, älä estä osoitteiden selaamista, kuten kohdan 2 tapaan.

Vahvista lopuksi korjaukset Search Consolen sivujen hakemistotiedoissa.

Huomaa, että korjausten vahvistamisessa tunnetusti voi kestää...

Lisää juttuja aiheesta

19.10.2022
404-virhesivut hakukoneoptimoinnin näkökulmasta
Jukka Peltoperä

Yksi yleisimmistä vastaan tulevista HTTP-tilakoodeista on 404 Not Found, mikä tarkoittaa kaikessa yksinkertaisuudessaan sitä, että asiakkaan pyytämää resurssia ei löytynyt, kun sitä pyydettiin palvelimelta. Jos suunnittelet verkkosivuja, ylläpidät verkkokauppaa tai […]

Lue juttu
18.10.2022
Googlen verkkovastaavan ohjeet on nyt Search Essentials
Jukka Peltoperä

Hyvästi Googlen Verkkovastaavan ohjeet. Tervetuloa Google Search Essentials! Google tiedotti viime viikolla julkaisevansa yksinkertaistetun version Verkkovastaan ohjeista ja nimeävänsä sen uudelleen Google Search Essentialsiksi. Uuden ohjeistuksen suomenkieliseksi nimeksi saattaisi englanninkielisen […]

Lue juttu
7.10.2022
Näin poistat syötteet käytöstä WordPressissä
Jukka Peltoperä

Haluatko poistaa RSS-syötteet käytöstä WordPress-sivustollasi? RSS-syötteet ovat hyvä tapa mahdollistaa blogin seuraaminen ja uusien blogijuttujen tilaaminen erilliseen RSS-lukijaan sekä blogin lisääminen erilaisiin aggregaatti- (engl. aggregator) eli kerääjä-, kooste- tai kokoomapalveluihin, […]

Lue juttu
22.8.2022
Googlen hyödyllisen sisällön päivitys
Jukka Peltoperä

Google tiedotti viikolla julkaisevansa ensi viikolla uuden päivityksen, jonka nimeksi on annettu helpful content update, so. hyödyllisen sisällön päivitys. Monet meistä ovat kokeneet turhautumista vieraillessaan verkkosivulla, joka hakutulossivulla näyttää tarjoavan […]

Lue juttu
20.6.2022
Mikä on paluulinkki?
Jukka Peltoperä

Paluulinkki on kaikessa yksinkertaisuudessaan linkki yhdeltä verkkosivustolta toiselle verkkosivustolle. Yleensä käsitteellä viitataan tietyn sivuston paluulinkkeihin eli kyseiselle verkkosivulle muilta verkkosivustoilta osoittavia linkkejä. Google ja muut hakukoneet käyttävät paluulinkkien määrää, laatua […]

Lue juttu
Jukka Peltoperä
Jukka Peltoperä
FM, tietojenkäsittelytieteet, Oulun yliopisto. Yrittäjä. Yli 20 vuoden kokemus web-suunnittelusta, web-teknologioista, WordPressistä, hakukoneoptimoinnista, sisällöntuotannosta ja digitaalisesta markkinoinnista.