Double Content unterbinden

Ein CMSimple Support Forum für deutsch sprechende Nutzer und Entwickler
Post Reply
Michael_G
Posts: 191
Joined: Thu Feb 18, 2016 11:01 pm
Contact:

Double Content unterbinden

Post by Michael_G » Sun Feb 04, 2024 9:10 am

Hallo allerseits,

unser CMSimple_XH vermeidet bereits theoretisch möglichen doppelten Content wie https://domain.tld/index.php u. a. m.
Aktuell bin ich aber auf eine weitere Variante gestoßen, die euch vielleicht auch neu ist: https://domain.tld/? (root)

Hintergrund:
Googles Search-Console hatte scheinbar (!) meine drei obersten Webseiten wegen Duplicate Content nicht indexiert.
Aber das ist tückisch, denn die Search Console zeigt die URL nicht komplett an, sondern unterdrückt das Fragezeichen im root …
Erst wenn man die bemängelte URL kopiert und woanders einfügt, z. B. bei https://wheregoes.com, um Umleitungen zu prüfen.

Dann sieht man das von Google nicht angezeigte Fragezeichen im Rootverzeichnis, also https://domain.tld/? sowie bei mehrsprachigen Websites z. B. https://domain.tld/de/? und https://domain.tld/en/?

Es ist kein dringendes Problem, denn meine richtigen Webadressen ohne das falsche Fragezeichen sind bei Google indexiert.
Aber vielleicht kann jemand von den Entwicklern diese mögliche DC-Ursache für das nächste Update berücksichtigen?

Danke! Wünsche allen einen schönen Sonntag und weiterhin viel Spaß mit CMSimple_XH!
Ciao
Michael

Let's Encrypt!

olape
Posts: 2752
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Double Content unterbinden

Post by olape » Sun Feb 04, 2024 6:32 pm

Ich glaube eigentlich nicht, dass das als DC zählt.
?, & und noch einige mehr dürfen in der URL selbst oder in den einzelnen Teilen des Query-Strings nicht verwendet werden.
Ersteres leitet den Query-String ein, das & verbindet mehrere Parameter.
Ich denke nicht, das ein leerer Query-String als DC gewertet wird.
Dann müsste man auch ein leeres Fragment (#) abfangen.

Sicherheitshalber kann ein Canoniciallink aber nicht schaden, denke ich.
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Michael_G
Posts: 191
Joined: Thu Feb 18, 2016 11:01 pm
Contact:

Re: Double Content unterbinden

Post by Michael_G » Tue Feb 06, 2024 7:38 am

Hallo Olaf,

vielleicht verstehst Du es besser, wenn ich es nochmal anders erläutere. ;-)

Ja, wenn man seine Webmaster-Hausaufgaben gemacht hat, bekommt man nur kurz einen Schrecken, warum die drei obersten Seiten (root mit und ohne die beiden Sprachen /de/ und /en/) angeblich nicht indexiert wurden.

Denn wie bereits erwähnt, listet Google die URLs nicht komplett, sondern lässt ein eventuelles Fragezeichen am Ende einfach weg (ich meine damit Googles Tabelle mit den URL-Beispielen:
Menü Seiten, dann Seitenindexierung, Auswahl Duplikat – vom Nutzer nicht als kanonisch festgelegt

Wer dann nicht ganz genau nachschaut bzw. die URL nicht kopiert und woanders einfügt, merkt nichts davon, dass Google gar nicht die sehr wohl indexierten Root-URLs ohne das unerwünschte Fragezeichen meint!
Gelistet werden bei mir dort u. a. https://domainname.tld/ und https://domainname.tld/de/ und https://domainname.tld/en/
Gemeint (!) sind aber https://domainname.tld/? und https://domainname.tld/de/? und https://domainname.tld/en/?

Wäre ich Webmaster-Neuling, hätte es mir also passieren können, dass Google nicht die gewünschten URLs indexiert.

Ich habe auf dieses Problem nur hingewiesen, weil sich nicht jeder CMSimple_XH-Nutzer mit SEO auskennt und manche Googles Search-Console sogar ignorieren oder viel zu selten dort nachschauen und viele kennen den Nutzen der Search Console gar nicht oder glauben, das wäre nur für Profis und Werbeplatzierung (Verwechslung mit Google AdSense).

Und die vom Browser (!) benutzte Sprungmarke # („Anker”) bekommen Server gar nicht richtig mit bzw. ignorieren sie.
Du weißt doch sehr genau, dass dies Sache des Browsers ist. ;-)
War gar nicht mein Thema. ;-)
Ciao
Michael

Let's Encrypt!

olape
Posts: 2752
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Double Content unterbinden

Post by olape » Tue Feb 06, 2024 9:07 am

Michael_G wrote:
Tue Feb 06, 2024 7:38 am
Gemeint (!) sind aber https://domainname.tld/? und https://domainname.tld/de/? und https://domainname.tld/en/?
OK, dann ist doch aber alles wie es soll. Google ignoriert den leeren Query-String.
Michael_G wrote:
Tue Feb 06, 2024 7:38 am
manche Googles Search-Console sogar ignorieren oder viel zu selten dort nachschauen
Ja, die sollte man schon nutzen, es werden Probleme aufgedeckt und es gibt viele Infos, ohne Datenschutzprobleme auf der Site zu haben.
Michael_G wrote:
Tue Feb 06, 2024 7:38 am
Und die vom Browser (!) benutzte Sprungmarke # („Anker”) bekommen Server gar nicht richtig
Stimmt, der Server nicht, die Suchmaschinen aber schon und darum ging es doch.
Grundsätzlich werden Sprungmarken (wenn sie einen sinnvollen Linktext haben) positiv gewertet (bessere Usability).
Aber man kann ja i.e. den Seitenanfang (top-Link) verschiedentlich setzen.

Code: Select all

<a href="">Zum Seitenanfang</a>

Code: Select all

<a href="#">Zum Seitenanfang</a>

Code: Select all

<a href="#top">Zum Seitenanfang</a>
Alle drei bringen ohne weiteres Zutun das gleiche Ergebnis.

Es ging mir nur darum, dass Google weiß, dass Links mit # kein DC sind. (Aber war ja nicht das Thema.)
Und genau das vermute ich auch bei einem leeren Query-String.
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Michael_G
Posts: 191
Joined: Thu Feb 18, 2016 11:01 pm
Contact:

Re: Double Content unterbinden

Post by Michael_G » Tue Feb 06, 2024 10:50 pm

Schade, Du hast mich wieder nicht verstanden.
Ciao
Michael

Let's Encrypt!

olape
Posts: 2752
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Double Content unterbinden

Post by olape » Wed Feb 07, 2024 4:33 pm

Michael_G wrote:
Tue Feb 06, 2024 10:50 pm
Schade, Du hast mich wieder nicht verstanden.
Doch, das denke ich schon.
Aber ich denke auch, wenn Google das von selbst ignoriert, ist es erstmal ok.
Ausserdem glaube ich nicht, das XH irgendwo solche Links generiert.
Ich wüsste also im Moment nicht, was wir tun könnten.
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Post Reply