Boris' blog

Tales of Mystery and Imagination..
  • Home
  • Impressum & Datenschutz

Google Base Seltsamkeiten…

Boris | 18. August 2009

Die meisten Leute machen sich sicherlich keine Gedanken darüber, woher die Daten kommen, wenn ihnen bei einer Google-Suche auch Produkte mit dazugehörigen Preisen angeboten werden. Die Antwort darauf heißt Google Base. Nun scheinen die Entwickler von Google Base jedoch ein etwas seltsames Völkchen zu sein, wie wäre sonst folgendes zu erklären?

Google Base ist ein Produkt das weltweit Betreibern von eCommerce Systemen zur Verfügung steht. Als Schnittstelle dient ein Datei-basierter Datenabgleich der entweder CSV Dateien oder eben auch RSS-basierte XML Dateien erwartet. Nun haben sich die Jungs von Google gerade bei letzterem etwas sehr Interessants ausgedacht: sie haben die XML Tags lokalisiert, d.h. XML Elemente die im englischen Original noch <g:price> heissen müssen für einen deutschen Shop auf <g:preis> geändert werden. Das erschwert nicht nur die Entwickling von Modulen die überall eingesetzt werden können, es scheint auch die Google Entwickler etwas zu verwirren. Schließlich definiert das RSS Format bereits einige Elemente, diese jedoch auf Englisch. Ein entsprechnder Block für einen Artikel sah also bis vor kurzem so aus:

<item>
    <id>123</id>
    <title>Mein Arikel</title>
    <g:preis>1.95</g:preis>
</item>

Seit rund zwei Wochen funktioniert das so jedoch nicht mehr, der Import solcher Dateien schlug einfach fehl und Google hüllte sich in Schweigen. Zum Glück wurde aber mittlerweile herausgefunden, wie man das Problem lösen kann. Ich denke der Mitstreiter aus dem Google Base Forum hat sicherlich einige Zeit gebraucht um die folgende Lösung des Problems zu finden:

<item>
    <id>123</id>
    <title>Mein Arikel</title>
    <c:titel>Mein Arikel</c:titel>
    <g:preis>1.95</g:preis>
</item>

Der Trick ist das Hinzufügen von <c:titel>, also der deutschsprachigen Variante des Titels. Bei dem “c” Namespace handelt es sich eigentlich um den Namespace für “Custom Attribute”, also solche Felder die vom Betreiber der eCommerce Seite definiert werden können. Mir scheint als wäre das Einlesen der Daten auf Google Base somit a) nicht Namespace fähig und b) erschreckend wenig robust und ungetestet.

Moral von der Geschichte: Lokalisierung von Datenformat ist mindestens genauso unsinnig wie der Übersetzung von Programmiersprachen.

(Update: Ein paar weitere Tipps gibt es noch in meinem Post “Importierte Google Base Feeds überprüfen”)

Categories
Code
Tags
deutsch, Google Base, XML
Comments rss
Comments rss
Trackback
Trackback

« Ergebnis Vorstandsbeschwerde vom 7. August 2009 Ursula von der Leyen glaubt es also noch immer… »

6 Responses to “Google Base Seltsamkeiten…”

  1. Christoph says:
    18. August 2009 at 14:06

    ah, jetzt wurden die tags aus meinem kommentar gelöscht. Also nochmal: das Attribut “c:titel” kann ersetzend verwendet werden, so dass “title” nicht mehr benötigt wird

    Reply
    • Boris Prüßmann says:
      18. August 2009 at 14:23

      Danke für den Tipp. Das wird mit Google sicherlich funktionieren, allerdings wäre das dann bestimmt keine valides RSS mehr…

      Reply
  2. Herbert says:
    18. August 2009 at 14:29

    Danke für den Beitrag! Hat uns super weitergeholfen…

    Reply
  3. Manuel says:
    19. August 2009 at 09:45

    sag mal, weißt du zufällig, ob man auch die Beschreibung anstatt als bzw. angeben muss? Weil bei mir komischerweise seit der Umstellung auf jetzt keine Beschreibungen mehr angezeigt werden…

    Reply
  4. Manuel says:
    19. August 2009 at 09:47

    sorry, nochmal: also ob man anstatt ‘description’ auch ‘beschreibung’ bzw. c:beschreibung angeben kann? habe nämlich description genommen und seitdem ich jetzt auf c:title umgestiegen bin ist die description weg…

    Reply
    • Boris Prüßmann says:
      19. August 2009 at 10:21

      Jein. ‘g:beschreibung’ wäre laut Google der richtige Name für das Attribute, wobei ich denke, dass es z.Zt. egal ist ob du ‘c:beschreibung’ oder ‘g:beschreibung’ nimmst. Guck dir mal meinen letzten Blog Post hier an…

      Reply

Leave a Reply

Click here to cancel reply.

CAPTCHA Image
Refresh Image
*

Archives

  • September 2011
  • June 2011
  • May 2011
  • April 2010
  • November 2009
  • August 2009

Categories

  • Allgemein
  • Code
  • Netzpolitik
  • Netzsperre
  • Photography
  • Sonstiges
  • T-Home

Blogroll

  • netzpolitik.org
  • note19.com
  • shop4design.de
  • today is tomorrow's past

Social Networks

  • Google+
  • LinkedIn
  • Xing
rss Comments rss valid xhtml 1.1 design by jide powered by Wordpress get firefox