Hallo allerseits,
unser CMSimple_XH vermeidet bereits theoretisch möglichen doppelten Content wie https://domain.tld/index.php u. a. m.
Aktuell bin ich aber auf eine weitere Variante gestoßen, die euch vielleicht auch neu ist: https://domain.tld/? (root)
Hintergrund:
Googles Search-Console hatte scheinbar (!) meine drei obersten Webseiten wegen Duplicate Content nicht indexiert.
Aber das ist tückisch, denn die Search Console zeigt die URL nicht komplett an, sondern unterdrückt das Fragezeichen im root …
Erst wenn man die bemängelte URL kopiert und woanders einfügt, z. B. bei https://wheregoes.com, um Umleitungen zu prüfen.
Dann sieht man das von Google nicht angezeigte Fragezeichen im Rootverzeichnis, also https://domain.tld/? sowie bei mehrsprachigen Websites z. B. https://domain.tld/de/? und https://domain.tld/en/?
Es ist kein dringendes Problem, denn meine richtigen Webadressen ohne das falsche Fragezeichen sind bei Google indexiert.
Aber vielleicht kann jemand von den Entwicklern diese mögliche DC-Ursache für das nächste Update berücksichtigen?
Danke! Wünsche allen einen schönen Sonntag und weiterhin viel Spaß mit CMSimple_XH!
Double Content unterbinden
Re: Double Content unterbinden
Ich glaube eigentlich nicht, dass das als DC zählt.
?, & und noch einige mehr dürfen in der URL selbst oder in den einzelnen Teilen des Query-Strings nicht verwendet werden.
Ersteres leitet den Query-String ein, das & verbindet mehrere Parameter.
Ich denke nicht, das ein leerer Query-String als DC gewertet wird.
Dann müsste man auch ein leeres Fragment (#) abfangen.
Sicherheitshalber kann ein Canoniciallink aber nicht schaden, denke ich.
?, & und noch einige mehr dürfen in der URL selbst oder in den einzelnen Teilen des Query-Strings nicht verwendet werden.
Ersteres leitet den Query-String ein, das & verbindet mehrere Parameter.
Ich denke nicht, das ein leerer Query-String als DC gewertet wird.
Dann müsste man auch ein leeres Fragment (#) abfangen.
Sicherheitshalber kann ein Canoniciallink aber nicht schaden, denke ich.
Gruß Olaf, Plugins for CMSimple_XH
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.
Re: Double Content unterbinden
Hallo Olaf,
vielleicht verstehst Du es besser, wenn ich es nochmal anders erläutere.
Ja, wenn man seine Webmaster-Hausaufgaben gemacht hat, bekommt man nur kurz einen Schrecken, warum die drei obersten Seiten (root mit und ohne die beiden Sprachen /de/ und /en/) angeblich nicht indexiert wurden.
Denn wie bereits erwähnt, listet Google die URLs nicht komplett, sondern lässt ein eventuelles Fragezeichen am Ende einfach weg (ich meine damit Googles Tabelle mit den URL-Beispielen:
Menü Seiten, dann Seitenindexierung, Auswahl Duplikat – vom Nutzer nicht als kanonisch festgelegt
Wer dann nicht ganz genau nachschaut bzw. die URL nicht kopiert und woanders einfügt, merkt nichts davon, dass Google gar nicht die sehr wohl indexierten Root-URLs ohne das unerwünschte Fragezeichen meint!
Gelistet werden bei mir dort u. a. https://domainname.tld/ und https://domainname.tld/de/ und https://domainname.tld/en/
Gemeint (!) sind aber https://domainname.tld/? und https://domainname.tld/de/? und https://domainname.tld/en/?
Wäre ich Webmaster-Neuling, hätte es mir also passieren können, dass Google nicht die gewünschten URLs indexiert.
Ich habe auf dieses Problem nur hingewiesen, weil sich nicht jeder CMSimple_XH-Nutzer mit SEO auskennt und manche Googles Search-Console sogar ignorieren oder viel zu selten dort nachschauen und viele kennen den Nutzen der Search Console gar nicht oder glauben, das wäre nur für Profis und Werbeplatzierung (Verwechslung mit Google AdSense).
Und die vom Browser (!) benutzte Sprungmarke # („Anker”) bekommen Server gar nicht richtig mit bzw. ignorieren sie.
Du weißt doch sehr genau, dass dies Sache des Browsers ist.
War gar nicht mein Thema.
vielleicht verstehst Du es besser, wenn ich es nochmal anders erläutere.
Ja, wenn man seine Webmaster-Hausaufgaben gemacht hat, bekommt man nur kurz einen Schrecken, warum die drei obersten Seiten (root mit und ohne die beiden Sprachen /de/ und /en/) angeblich nicht indexiert wurden.
Denn wie bereits erwähnt, listet Google die URLs nicht komplett, sondern lässt ein eventuelles Fragezeichen am Ende einfach weg (ich meine damit Googles Tabelle mit den URL-Beispielen:
Menü Seiten, dann Seitenindexierung, Auswahl Duplikat – vom Nutzer nicht als kanonisch festgelegt
Wer dann nicht ganz genau nachschaut bzw. die URL nicht kopiert und woanders einfügt, merkt nichts davon, dass Google gar nicht die sehr wohl indexierten Root-URLs ohne das unerwünschte Fragezeichen meint!
Gelistet werden bei mir dort u. a. https://domainname.tld/ und https://domainname.tld/de/ und https://domainname.tld/en/
Gemeint (!) sind aber https://domainname.tld/? und https://domainname.tld/de/? und https://domainname.tld/en/?
Wäre ich Webmaster-Neuling, hätte es mir also passieren können, dass Google nicht die gewünschten URLs indexiert.
Ich habe auf dieses Problem nur hingewiesen, weil sich nicht jeder CMSimple_XH-Nutzer mit SEO auskennt und manche Googles Search-Console sogar ignorieren oder viel zu selten dort nachschauen und viele kennen den Nutzen der Search Console gar nicht oder glauben, das wäre nur für Profis und Werbeplatzierung (Verwechslung mit Google AdSense).
Und die vom Browser (!) benutzte Sprungmarke # („Anker”) bekommen Server gar nicht richtig mit bzw. ignorieren sie.
Du weißt doch sehr genau, dass dies Sache des Browsers ist.
War gar nicht mein Thema.
Re: Double Content unterbinden
OK, dann ist doch aber alles wie es soll. Google ignoriert den leeren Query-String.Michael_G wrote: ↑Tue Feb 06, 2024 7:38 amGemeint (!) sind aber https://domainname.tld/? und https://domainname.tld/de/? und https://domainname.tld/en/?
Ja, die sollte man schon nutzen, es werden Probleme aufgedeckt und es gibt viele Infos, ohne Datenschutzprobleme auf der Site zu haben.
Stimmt, der Server nicht, die Suchmaschinen aber schon und darum ging es doch.
Grundsätzlich werden Sprungmarken (wenn sie einen sinnvollen Linktext haben) positiv gewertet (bessere Usability).
Aber man kann ja i.e. den Seitenanfang (top-Link) verschiedentlich setzen.
Code: Select all
<a href="">Zum Seitenanfang</a>
Code: Select all
<a href="#">Zum Seitenanfang</a>
Code: Select all
<a href="#top">Zum Seitenanfang</a>
Es ging mir nur darum, dass Google weiß, dass Links mit # kein DC sind. (Aber war ja nicht das Thema.)
Und genau das vermute ich auch bei einem leeren Query-String.
Gruß Olaf, Plugins for CMSimple_XH
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.
Re: Double Content unterbinden
Schade, Du hast mich wieder nicht verstanden.
Re: Double Content unterbinden
Doch, das denke ich schon.
Aber ich denke auch, wenn Google das von selbst ignoriert, ist es erstmal ok.
Ausserdem glaube ich nicht, das XH irgendwo solche Links generiert.
Ich wüsste also im Moment nicht, was wir tun könnten.
Gruß Olaf, Plugins for CMSimple_XH
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.
Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.