Sitemap | Über uns | Impressum |
Home | Produkte | Download | Support | Bestellen/Kaufen

DeuPAD Ressourcen

FAQ zu PAD

Der Workshop enthält Fragen und Antworten zum PAD Standard und zur Integration von PAD in Softwarearchive.

Folgende Fragen werden in dieser FAQ beantwortet:
 

Was ist PAD?
Wer steht hinter PAD?
Wer unterstützt bereits PAD?
Wo finde ich weitere Informationen zu PAD?
Wie sieht der PAD Standard nun genau aus?
Welche Vorteile entstehen für ein Downloadarchiv durch Verwendung von PAD?
Welche Vorteile entstehen für die Autoren durch Verwendung von PAD?
Welche Möglichkeiten gibt es, PAD in einem Downloadarchiv einzusetzen?
Was ist beim Annehmen von PAD Anmeldungen zu beachten?
Was ist beim Spidern von PAD Dateien zu beachten?
Welche Technologie wird benötigt, um PAD Dateien auf dem Server zu verarbeiten?
Gibt es irgendwo ein Beispiel für ein Softwarearchiv mit PAD Anmeldung und Spidern der PAD Dateien?
Gibt es eine Liste mit existierenden PAD Dateien als Grundstock für ein Softwarearchiv?

Was ist PAD?

Das PAD (Portable Application Description) Format ist ein internationaler Standard für die Beschreibung von Shareware- und Freewareprodukten.

Der PAD-Standard legt fest, welche Informationen wie an welchem Ort zu hinterlegen sind, damit ein Softwareprodukt komplett beschrieben ist. Die Informationen werden in einer ASCII Datei zusammengefasst. Diese Datei wird dann dem Produkt beigelegt und gleichzeitig an einem festen Ort im Internet veröffentlicht. Somit können Produktinformationen auch gelesen werden, ohne ein Produkt herunterzuladen und zu installieren.

Wer steht hinter PAD?

Der PAD Standard wurde von der Autorenvereinigung ASP (Association of Shareware Professionals) definiert. Die deutsche Shareware Autorenvereinigung SAVE mit über 1500 deutschsprachigen Autorenmitgliedern unterstützt ebenfalls den PAD Standard.

Um die Verbreitung des PAD Formats im deutschsprachigen Raum zu fördern wurde das Projekt DeuPAD ins Leben gerufen. Auf der DeuPAD Website unter http://www.deupad.org finden sich alle nötigen Informationen rund um das PAD Format. Workshops geben nützliche Tipps zu PAD. Zudem gibt es zwei kostenlose Tools zum Download: den DeuPAD Editor zum einfachen Erzeugen von PAD Dateien und den DeuPAD Reader zum Betrachten, Vergleichen und Aktualisieren von PAD Dateien. Im DeuPAD Editor sind die sog. DeuPAD Erweiterungen enthalten. Dabei handelt es sich um eine Aufweitung des PAD Grundformats um einige wichtige Informationen, die speziell im deutschen Sprachraum relevant sind.

Wer unterstützt bereits PAD?

Mehrere zehntausend Shareware- und Freewareprodukte verfügen bereits über eine PAD Beschreibung. Diese Zahl wächst ständig, fast täglich kommen weitere Hersteller hinzu.

Auch eine hohe Zahl an Softwarearchiven unterstützt bereits die Anmeldung mittels PAD.

Dieser Trend wird also dahin führen, dass in naher Zukunft nur noch Softwarearchive mit PAD Unterstützung durch die Autoren mit Programmdaten versorgt werden.

Wo finde ich weitere Informationen zu PAD?

Hier finden Sie weiterführende Informationen zu PAD.

Wie sieht der PAD Standard nun genau aus?

Der PAD Standard gliedert sich in zwei Teile. Zunächst definiert der Standard die sog. "PAD Datei". Eine PAD Datei ist eine gewöhnliche ASCII Datei, die mit jedem Dateieditor gelesen oder bearbeitet werden kann. In jeder PAD Datei werden Informationen über ein Softwareprodukt, sowie zu dessen Hersteller festgehalten. Die Informationen werden im XML Format notiert, der Umfang der Informationen ist im PAD Standard beschrieben. Hier einige Ausschnitte aus einer solchen PAD Datei:

[...]
  <Company_Info>
    <Company_Name>GRAHL software design</Company_Name>
    <Address_1>Nikolastr. 46 c</Address_1>
    <Address_2 />
    <City_Town>Landshut</City_Town>
    <State_Province />
    <Zip_Postal_Code>84034</Zip_Postal_Code>
    <Country>Deutschland</Country>
    <Company_WebSite_URL>http://www.GRAHL-software.de</Company_WebSite_URL>
    <Contact_Info>
      <Author_First_Name>Oliver</Author_First_Name>
      <Author_Last_Name>Grahl</Author_Last_Name>
      <Author_Email>infoGRAHL-software.de</Author_Email>
      <Contact_First_Name>Oliver</Contact_First_Name>
      <Contact_Last_Name>Grahl</Contact_Last_Name>
      <Contact_Email>infoGRAHL-software.de</Contact_Email>
    </Contact_Info>
[...]
  </Company_Info>
  <Program_Info>

    <Program_Name>DeuPAD</Program_Name>
    <Program_Version>2.0.0.29</Program_Version>
    <Program_Release_Month>08</Program_Release_Month>
    <Program_Release_Day>23</Program_Release_Day>
    <Program_Release_Year>2004</Program_Release_Year>
    <Program_Cost_Dollars />
    <Program_Cost_Other />
    <Program_Type>
Freeware</Program_Type>
    <Program_Release_Status>Minor Update</Program_Release_Status>
    <Program_Install_Support>Install and Uninstall</Program_Install_Support>
    <Program_OS_Support>Win95,Win98,WinME,WinNT 4.x,Windows2000,WinXP,Windows2003</Program_OS_Support>
    <Program_Language>German</Program_Language>
[...]
  </Program_Info>
  <Program_Descriptions>
    <German>
      <Keywords>
deupad, pad, file_id,diz, file_id.diz, program, description, shareware, autor, freeware, portable application description</Keywords>
      <Char_Desc_45>
PAD Editor für Software-Hersteller</Char_Desc_45>
      <Char_Desc_80>
Werkzeug für Software-Hersteller zum Erstellen und Bearbeiten von PAD-Dateien.</Char_Desc_80>
      <Char_Desc_250>
DeuPAD ist ein Werkzeug für Software-Hersteller zum Erstellen, Bearbeiten und Anzeigen von PAD Dateien. PAD ist das standardisierte Format zur Weitergabe von Hersteller- und Programm-Informationen von Softwareprodukten.</Char_Desc_250>
      <Char_Desc_450>
DeuPAD ist ein Werkzeug für Software-Hersteller zum Erstellen, Bearbeiten und Anzeigen von PAD Dateien. PAD ist das standardisierte Format zur Weitergabe von Hersteller- und Programm-Informationen von Softwareprodukten. Diese Informationen können von Download-Archiven, Redaktionen und Händlern weiterverwendet werden. DeuPAD unterstützt den kompletten Sprachumfang des Portable Application Description Formats (PAD 2.01).</Char_Desc_450>
[...]

Der PAD Standard legt hierbei genau fest, welche Datenfelder in die PAD Datei gehören, und wie dieses zu benennen sind. Damit ist die Voraussetzung zum maschinellen Auslesen der Datei gegeben.

Der zweite Teil des PAD Standards beschreibt den Ort, an dem die, für ein bestimmtes Programm erzeugte PAD Datei zu hinterlegen ist. Die PAD Datei wird an zwei Orten gehalten. Erstens wird die Datei dem Produkt selbst beigelegt. Das heisst, die Datei wird z.B. mit in das Distributions- oder Installationsarchiv für das Programm gepackt, i.d.R. sind das *.zip oder *.exe Dateien. Zweitens wird die Datei auf dem WWW Server des Herstellers hinterlegt, z.B. unter der Adresse http://www.hersteller.com/produktname/pad_file.xml oder http://www.hersteller.com/produktname.xml .

Die Datei an diesem Ort wird vom Hersteller für die gesamte Lebenszeit des Produkts aktuell gehalten. Damit sind zwei weitere Dinge gewährleistet: die Produktinformationen können gelesen werden, ohne das Produkt herunterzuladen oder zu installieren. Und die Produktdaten können in regelmäßigen Abständen durch erneutes Lesen der PAD Datei aktualisiert oder auf Änderungen geprüft werden.

Welche Vorteile entstehen für ein Downloadarchiv durch Verwendung von PAD?

Einige Vorteile für die Redaktionen der Softwarearchive sind:

Endlich eine Möglichkeit Produktinformationen zu lesen, ohne das Produkt zu installieren.
Endlich alle relevanten Informationen an einem Ort
Endlich die Möglichkeit, diese Informationen durch automatisierte Prozesse zu verarbeiten
Die Möglichkeit, durch regelmäßiges Abrufen der Produktinformationen von Aktualisierungen zu erfahren, ohne dass der Autor diese erst bei Ihnen melden musste.
Endlich mehr Zeit für die journalistische Aufbereitung der Informationen anstelle der ewigen Suche nach diesen Informationen.
Autoren werden tragen ihre Produkte zuerst, tw. nur noch in Archive mit PAD Unterstützung ein.

Welche Vorteile entstehen für die Autoren durch Verwendung von PAD?

Einige Vorteile für den Autoren sind:

Wegfall der lästigen Eintipperei von Produktinformationen bei diversen Softwarearchiven und Redaktionen.
Potentiell mehr Aufmerksamkeit auf das Produkt, da die Produktinformationen von den Redaktionen problemlos und aktuell verarbeitet werden können.
Potentiell die Möglichkeit, ohne eigenes Zutun mit aktuellen Daten in Archiven vertreten zu sein.
Positivere Presse durch grundlegend glücklichere und zufriedenere Redakteure! ;-)

Welche Möglichkeiten gibt es, PAD in einem Downloadarchiv einzusetzen?

Die Integration von PAD in ein Softwarearchiv erfolgt in zwei Schritten:

1. Software-Anmeldungen über PAD ermöglichen
2. Regelmäßiges Aktualisieren der über PAD gemeldeten Daten ("Spidern")

Beide Leistungsstufen können chronologisch versetzt implementiert werden.

Ergebnis der ersten Leistungsstufe wird eine Alternative zu den in den meisten Archiven verbreiteten Meldeformularen sein. Anstelle das komplette Formular auszufüllen wird den Autoren die Option angeboten, nur die URL der PAD Datei für das Produkt anzugeben. Daraufhin liest der Archivserver die benötigten Daten selbständig aus der PAD Datei aus.

In der zweiten Leistungsstufe wird ein Mechanismus implementiert, der in regelmäßigen Abständen alle mit PAD eingetragenen Programme durch erneutes Abrufen der Produktdaten aus der PAD Datei aktualisiert. Auf diese Weise wird das Archiv aktuell gehalten, ohne auf explizite Updatemeldungen der Autoren angewiesen zu sein.

Was ist beim Annehmen von PAD Anmeldungen zu beachten?

Der Anmeldung einer PAD Datei liegt folgender Prozess zugrunde:

1. Eingabe der PAD URL durch den Anmelder
2. Server lädt die PAD Datei von der angegebenen URL
3. Kann die PAD Datei nicht geladen werden (Datei existiert nicht, Server ist ausgefallen o.ä.), erfolgt eine Fehlermeldung an den Anmelder -> Ende
4. Server validiert den Inhalt der PAD Datei
5. Enthält die PAD Datei ungültige Daten, Fehlermeldung an Anmelder ausgeben -> Ende
6. Server liest die benötigten Daten aus der PAD Datei
7. Server prüft, ob die Datei früher schon ins Archiv eingetragen wurde
8. Wenn ja, wird der bestehende Datensatz aktualisiert
9. Wenn nein, wird ein neuer Datensatz angelegt
10. Server schreibt den aktualisierten oder neuen Datensatz in die Datenbank
11. Rückmeldung an den Anmelder (Anmeldung erfolgt)

Alle Schritte erfolgen "on the fly", also ohne zeitliche Verzögerung. Der Anmelder erhält eine Fehler- oder Erfolgsmeldung innerhalb weniger Sekunden.

Die PAD URL wird für späteres Spidern in den Datensatz gespeichert.

Bei einigen Datenfelder (z.B. Preis, Produktbeschreibungen) ist zu beachten, dass alternative Felder gelesen werden sollten, falls das gewünschte Feld keine Daten enthält (Beispiel: Beschreibung mit 450 Zeichen soll gelesen werden. Lese folgende Felder, bis ein Feld gefunden wird, das nicht leer ist:

<Program_Descriptions><German><Char_Desc_450>
<Program_Descriptions><German><Char_Desc_250>
<Program_Descriptions><German><Char_Desc_80>
<Program_Descriptions><German><Char_Desc_45>
<Program_Descriptions><English><Char_Desc_450>
<Program_Descriptions><English><Char_Desc_250>
<Program_Descriptions><English><Char_Desc_80>
<Program_Descriptions><English><Char_Desc_45>

Ein weiteres Beispiel: Der Preis soll gelesen werden, vorzugsweise in Euro: Lese folgende Felder (ggf. umrechnen):

<DeuPAD><Program_Cost_EUR>
<Program_Info><Program_Cost_Dollars>
<Program_Info><Program_Cost_Other> +
  <Program_Info><Program_Cost_Other_Code>

Was ist beim Spidern von PAD Dateien zu beachten?

Dem Spidern der PAD Dateien liegt folgender Prozess zugrunde:

1. Datenbank sperren (keine Anmeldungen während dem Spidern)
2. Ersten Datensatz aufrufen
3. PAD Datei von PAD URL laden
4. Kann die PAD Datei nicht geladen werden (Datei existiert nicht, Server ist ausgefallen o.ä.), Fehler protokollieren und Datensatz überspringen -> nächster Datensatz
5. Inhalt der PAD Datei validieren
6. Enthält die PAD Datei ungültige Daten, Fehler protokollieren und Datensatz überspringen -> nächster Datensatz
7. Benötigte Daten aus PAD Datei lesen
8. Evtl. neue Daten mit alten Daten vergleichen, um festzustellen, dass ein Update des Produkts erfolgte (z.B. um die Archivbesucher auf das Update hinzuweisen)
9. Neue Daten schreiben
10. Nächster Datensatz
11. Zuletzt Datenbank wieder freigeben

Zu beachten ist außerdem:

Der Vorgang ist fehlertolerant zu implementieren, damit ein Fehler beim Spidern einer PAD Datei nicht zum Abbruch des gesamten Jobs führt.
Fehler beim Spidern sind zu protokollieren. Treten bei einer Datei fortlaufend Fehler auf (ohne Unterbrechung über mehrere Wochen), kann der Datensatz gelöscht werden. Vorher sollte eine Benachrichtigung an den Hersteller erfolgen.
In der PAD Datei ist im Feld die PAD URL enthalten. Dieses Feld ist bei jedem Spidern auszulesen und in der Datenbank zu aktualisieren. In dem seltenen Fall, dass der Ort einer PAD Datei während der Lebenszeit des Produkts geändert wird, gibt der Hersteller hier die neue Adresse an und lässt die PAD Datei an der alten Adresse für eine Übergangszeit bestehen.
Als typisches Intervall für das Spidern ist der tägliche oder wöchentliche Rhythmus anzuwenden.
Preisgünstige Webhosting Provider beschränken die maximale Rechen- und Laufzeit von CGI Programmen. Nach Erreichen eines dieser Maxima wird der CGI Prozess einfach abgebrochen. Da das Spidern einer höheren Anzahl PAD Dateien längere Zeit in Anspruch nimmt werden solche Zeitgrenzen meist erreicht. Man sollte sich rechtzeitig beim eigenen Provider über diese Timeouts informieren. Folgende Workarounds sind denkbar: 1. Durchführen des Spiderns "offline" auf einem lokalen Rechner und Rückspielen der aktualisierten Daten auf den Webserver. 2. Das Skript zum Spidern so auslegen, dass die gelesenen Änderungen nach jeder PAD Datei in die Datenbasis zurückgeschrieben werden und für jeden Datensatz die erfolgte Aktualisierung vermerkt wird. Durch mehrmaliges Aufrufen des Skripts wird die gesamte Datenbasis blockweise abgearbeitet. 3. Eventuell gelten die Timeout Beschränkungen nicht für Prozesse, die direkt aus der Shell (z.B. über Telnet) gestartet werden, anstelle CGI zu nutzen.

Welche Technologie wird benötigt, um PAD Dateien auf dem Server zu verarbeiten?

Der Server benötigt die Möglichkeiten, Dateien über das HTTP Protokoll zu lesen und XML Dateien auszuwerten.

Das Lesen der Dateien über HTTP kann je nach verwendeter Technologie z.B. mit Perl (LWP Modul), ASP (z.B. ASPHttp), ASP.NET oder PHP erfolgen.

Das Parsen der XML Dateien kann ebenfalls in Perl (XML:Parser, XML:DOM oder einfache Implementierung aus Workshop), ASP (Microsoft.XMLDOM) oder PHP (XMLDOM) implementiert werden.

Gibt es irgendwo ein Beispiel für ein Softwarearchiv mit PAD Anmeldung und Spidern der PAD Dateien?

Ja! Der Workshop PAD Demoarchiv enthält eine Perl Implementierung eines einfachen Softwarearchivs mit PAD Unterstützung. Teile dieser Demo können direkt für eine eigene Implementierung weiterverwendet werden.

Der Workshop PAD Form Demo zeigt außerdem eine einfache Möglichkeit, PAD in bestehende Meldeseiten von Softwarearchiven zu integrieren.

Weiteren Beispielcode finden Sie im PAD SDK der ASP (PAD SDK) und in Form des PADKit der ASP (PADKit).

Gibt es eine Liste mit existierenden PAD Dateien als Grundstock für ein Softwarearchiv?

Ja! Im DeuPAD Verzeichnis kann unter "Profi-Abfrage", "Beispiele" eine Liste mit allen, im DeuPAD Verzeichnis gemeldeten PAD Dateien abgerufen werden. Die Shareware Autoren Vereinigung SAVE stellt ausserdem ihr Softwareverzeichnis mit mehreren tausend deutschsprachigen Programmen im Rohformat (CSV-Dateien) zum Download zur Verfügung. Auf den PAD Seiten der Association of Shareware Professionals ASP kann im PAD Repository ebenfalls eine Liste mit mehreren zehntausend internationalen PAD Dateien geladen werden.


Mehr Ressourcen...

  T E S T E N   »
Presseecho
c't: Liegt der Text erst einmal in schönem Layout vor, etwa als PDF, kann man ihn mit den üblichen Office-Programmen kaum noch bearbeiten. In diese Bresche springt der PDF Annotator, mit dessen Hilfe man die Dokumente mit elektronischer Tinte kommentieren und als neue PDFs abspeichern kann. Mehr